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人类从遥远的古代就以描■述方法记载自己的历史。当史卷主 
要记述英雄人物的丰功伟缋或历史事件的来龙去脉时，描述方法 
是十分胜任的。19世纪末，由于资本主义经济的发展，要求对经济 
史进行研究，产生了运用计量方法处理经济指数进而分析经济史 
规律的需要。英国经济学家鲁格斯的英国农业及价格史就是适应 
这种需要产生的代表作。20世纪，由于经济、阶级、社会 的巨大 
变化，人类对人自身及社会的再思考，使历史学家的视野从聚焦 
于英雄人物、历史事件转向劳动大众和社会结构6这就要处理数 
量浩繁、散见的历史文献。于是，运用统计计量整理、分析历史 
文献的计量方法开始在西方，首先是在法国年鉴学派的研究中出 
现。例如，法国年鉴学派最著名代表人物之一 E - 拉布鲁斯的著 
作都是以大量经过统计整理的挡案为基础，他以计量方法研究社 
会结构的动态变化，被认为在他带动下，儿乎整整一代法国历史 
学家学会了计量。 

本世纪二三十年代后，计量方法以它自身固有的优越力量开 
始逐步征服史学界。从50年代后期起，在美国开始形成具有一定数 
量的研究队伍、常设研究机构、正式刊物的计量史学派。在美 H 的 
带动.和示范下，历史的计 量研究 方法横越大西洋传播到曰本 、西 
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欧及至苏联东欧。至 TO 年代末，形成令国际史学界瞩目的国际计量 
史学潮沆，并且与马克思主义的传播、法®年鉴学派的兴起并称 
为本世纪世界史学界最有影响的三大变化之一。 

苏联计量史学在 so 、 60年代 之交® ^復和兴起。 这除售 
史学寒遇到运用传统方法无法解决的难题，要求探 f 
量方法在国外已显露出&传统方法有优越之处，从而吸引着苏联 
史学家以外，还有着苏联独特的背景： 1 SS 6 年苏共 2 0大以后，与赫 
鲁晓夫主张改革、反对个人迷信相适应，史学界开始肃清"左_’ 
的教条主义钩影响，其中重要的一点是将史学方法论作为一个 
独立的发展主体提 出涞/ 指出历史唯物主义只是指导史学方法论 
的理论，不能取代史学方法论。这就莫定了计量方法作为历史研 
究方法之一而独立发展的理论基础。_ 

60 年代是苏联计量史学初具规模的时期，无论在理论还是实 
践方面都是如此。在理论方面，这一时期历史 f 寒注.意的中心是 
是否有必要运用计量方法 （ IO . IO . 卡赫克:《需要新的历史科学 
吗？》，1阳9年）、计量方法运用的范围以及地位 （H ■ 3 -科瓦利. 
琴科 ■_ 《论历史研究中的教学方法》， I 969 年等）。在实践方面，研 
究重心集中于经济史，首先是俄®个别地区农业史历史资料的整 
理与分析上 （ 卡 赫克： 《运用电子计算机对爱沙尼见历史的研究》， . 
19(34 年；科瓦利 琴科： 《对19世纪俄国农民经济抽样材料进行数学 
统计整理的尝试；年等）。 

70年找是苏联计量史学起飞并取得重要成果的阶段。在理论 
方面，历史 学家对 历史计 量理论的探讨 已深入到方法论的层次 
(卡赫克1科瓦利琴科 ：(( 在历史研究中运用计量方法的方法论问 
越 .》， W 74 年等在实践 方面，这一时期有三个最显箸的特 征：一 
是运用计童戈法的范围从经济史扩及到社会政治史、文化史:#领 
域 5 二是提出.*解决了传统方法难以或无法解决的研究课题。这 



一时期，俄国农业史仍是历史学家注意的中心。苏联历史学家主要 
运用摸拟的方法，力图.完整地揭示封建地主经济的内部结构、实 
质和机制。.他们通过处 S 大量的统计资料，制成了 17—^0 世-纪顿"® 
社会经济结构的摸型，揭示了地主经济与农奴_相互為赛 jt # 
征。同时研究了俄罗斯统一民族市场的形成问题 - r-tr 不又信服的 
结论，结束了有列宁提出这一 M 题后近80年史学界对这个问题的 
争论。三是加强了对计量史学的组织、推广工作。70年代计董史学 
的迅速发展，提出了加强迓织工作的要求，为适应这一要求，70年 
我初苏联科学院历史学部成立了协调计量史学活动的正式领导机 
构——历史研究中运用数学方法和电子计算机委员会。该委员会 
句推动计量史学的发展作了一系列重要的工作，包括编辑出版论 
文集（《历史研究中的数学方法》，1972年；《社会经济史研究中的数 
学方法》，1975 年； 《经济史和文化史研究中的数学方法》，1977 年）、 
组织国际学术交流 （ 如〗979年在苏联塔林组织了苏美两国计量史 
学学术讨论佘 ) 等。7 0年代末莫斯科大学历史系苏联史教研室还 
组织了一个经常性的__历史研究中的计量方法”讲习班，以解央 
史学研究中运用数学方法的各种问题 3 

- 70年代，不仅计量史学在苏联楫到迅速发展，而且其他跨学 

科的史学分支，如历史社会学、历史人 口学、 历史心理学等也 
得到长足发展。这是世界范围内由于科学技术革命的深刻影响而 
曰益加强的科学整体化趋势的反映。在这种背景之下，不仅计量 
史学会于自身的发展需要加强组织，总结提高，而且科学整体化 
的趋势也提出了相同的要求。其他新兴学科的情况亦是如此。正 
是在这样的背*之下，苏联科学院编辑出舨了 《当 代科学发展趋 
势》丛书，《历史学家与数学》作为对计量史学发展诸方面的总结 
而于1975年推出。 ^ 








在历史研究中使用计量方法的最重要步骧， 


是对 a 者所提 


出课题的数量指数进行数学的统计加工与分析。根据 k ■一翁厂 


本书的结构可分为两大部分。 

第一部分包括第一二章，主要叙述对历史资料的统计 加工， 
-重点 回答了 三个问 题。 

第 一 ，质是否能够以及如何转化为量。 

历史学家主要与质的形式的史料打交道。因为19世纪以前人 
们不善于用数字记载历史，而且大多数軍始事实不可能以量的形 
式出现 a 这样，对历史进行计量分析碰到的第一个问题，就是质 
是否能够以及怎样转化为量。在书中，作者首先指出每一客体都 
是质与置的规定性的统一体，因此质与量是互相联系、互相转化 
的。 接着作者详细介绍了将质转化为量的三种方 法:. 计算一计 
算被研究客体质的各个特征重复出现的频数；统计计量——确定 
一个客体对另一个客体关系有几种边界点，并寻找这些边荠点的 
数量当董；_分解概念——将某一质的历史概念分解为若干可以计 
量的个别因素，进而对每个因素逬行计量 。 归纳起来，对质的历 
史现象可以从三个角度进行统计描述：在时间和空间范围内重复 
出现频数或水乎和强度的角度；时间，空间延续的角度；结构的 
角度。因此，当研究各种最复杂的问题时，只要能把这些问题歧 
于某一个问题之下，再分解成各个单独的简单的问题，就可以根 
据上述方法进行计量。这样，作者自然而然地固答了这个至关重 
要的问题：实际上一切都 是可以 计量的 & 通过 le 世纪俄罗斯人如何 
看待涨价隊因、对1917 —1929年最高国民经济委员会活动的分 
折、 W ~ 2 0 世纪饿国统 1 一粮食市场发展三个例子，作者详细介绍 





了如何将质转化为 #进 而进行计董。 

第二，当历史学家整理数量形式的史料时会遇到另一个问 
题：具有多大误差的史料可以认为是准确可信 

作者首先指出，历史#料都具有相对准确主要^受 
间与地理延续性的局限、收集材料者社会经济 k 益的局1 以及历 
史学家很难 T 解历史材料形成条件的局限 a 作者针对关于通过整 
理史料误差可以抵消或依然如旧两种极端观点，运用概率的方法 
得出 结论， 与实际误差在 20 钧以内 的材料就可以认为是奸的史 
料，历史学家可以大阻地运用它进行科学研究。 

第三，历史学家经常遇到的另一问题是，由于年代久远 、史 
料短缺，无法客观全面地评述当时的历史，或者是材料浩繫，不 
知如何选择能够代表总体的起码数量的材料，以避免过于繁复的 
计算。作者介绍了.能够圆满解决上述问题的抽样方法诸原 

1. 抽样的最基本的随机原则； 2* 保证随机的抽样法-抽签、 

随机数字、机械抽样、典型抽样、聚点抽样法等确定史料是 
否遵循了隨机原则的符号判据法； 4 +处理太数量史料保证随机原 
则的公式 i 5. 抽样方法的数学基础一大数 定律。 在这部分里， 
作者列举了两个成功地运用抽样方法的实例 * 通过确定俄国世 
纪平均价格而得出结论，俄国价格革命比欧洲晚 ISO 年；通过论证 
3 9世纪上半叶农民状况已经恶化，解决了俄国农4史上最有争议 
的问题。 

第二 部分，包括第 三至五 章 & 主要叙述如何对历史课题进行 
裝计分析。历史学家的主要任务是揭示历史现象之间的客观规 
律，这就要正确地评估历史现象之间的关系。概括起来，历史现 
象之间的关系可分为三种 * 量的形式之间的关系，质的形式之间 
的关系，质的与量的形式之〖司的关系 & 在这里，作者从众多的数 
学方法中精选了三种最基本、最常用的方法进行了详细介绍。 





对 ft 的形式间的关系可以运用回归方法:与相关方法进行统:计 
分析。回归分析能够揭示自变量（尿因、 因棄） 与®变量（结果） 

之间数量关系的雖式 & 相关方法 可以测 定变量之间是 否 在联^^ 
系以及因素对结果变董影响的程度。作者介绍了回归 f 相 
的一般步骤：进行具体历史与逻辑的分析以确定_历史 k 泉的遂藥 
关系；整理历史现象的数据以绘制回归图表 I 计算®归系数以建立 
回归方 程 （ 变量之间关系的数 学表达 式）；求估计标准误差 （ 评价 
回貯系数的代表 性）； 求相关系数（确定变量之间关系的紧密度）。 

对质的形式可以运用等级相关方法进行分析。如果研究性质 
对立或具有程度变化特征间的关系，■可以用联系系数和连结系 
数,研究可按等级排列的质的特征可以借助斯皮尔门相关系数和 
肯德尔相关系数。分析的步骤是对每个研究对象进行分析整理， 

定出一系列等级，制定等级表，根据公式计算相关系数。 

作者还'指出了回扫分析与相关分析的各种类型：根据因素数 
量区分的多元回归、多元相关； 根据数 学表现形态区分的曲线相关 
——抛物线相关 * 双曲线相夫、指数、对数相关筹。归納了运用 
面归与相关指数的条件与禁忌。 

当分析质与量特征间的关系时，用方差分析。方差分析具有 
与相关分析相同的宗旨 t 探求变量之间是否存在着依从关系以及 
关系的紧密度。区别只在于适用的范围不同，这里作者详细介绍 
了单因素与多0素方差分析的具体步骤， 

书中，作者还概栝了计量分析方法对传统史学方法的变革， 

即研究起点不同1不是从 直接收 集材料开始，而是从明确地提出 
问题、建立指标体系、提出课题假设开始> 收集材料的方法不 
同：仅收集那些于所提出问题及验证假设所必须的材料 I 能够验 
证研究结果 6 因此，计量方法较之传统史学方法的优越之处，不 
仅在于解决问超具有精确性和明确性，而旦能够解决用传统方法 





难于戚无法解决的课 题。 



该书立足于使对计量史学究全陌生的读者了 nf -掌 拫计 量分 
析的基本原则和方法，因而从两个方面安排了本书的 内容： 回答这 
些读者在计量分析中最迫切需要答案和最经 f 遇到的问 题； 精选 
和介绍 M 常用的、能够概括计量分析基本方面的数学方法。这样安 
排内客，使读者能够迅捷地了解并掌握计量史学的概捷 和 基本方 
法,避免由于一下出现许多数学方法而使读者不得要颌甚至望而 
却步，这是颇具匠心的， 

该书广泛吸收了苏联计量史学的研究成果，尤其注意慑引运 
用传统史学方法争议不下或运用计量分析修正了传统看法的课 
题，扼要地叙述计量方法何以解决了难题或修正了传统观点，从 
而既能使 读者看 到计量方法的优越之处，又能激起他们对深入了 
解计量方法、甚而实践计 M 方法的兴趣和热情。这种写作方法是 
颇具特色的^ 

19 S 4 年，苏联出版了第一部供大学历史系所用的计量史学教 
科书，提出使历史学家不仅掌握描述分析方法，而且掌 IS. 计量分 
析方法的设想。近年，国外一些历史学家也升始讨论对历史学家 
进釕计量方法和电子计算机的再培训问题。这表明，在科学竺体 
化趋势曰益加强的当今时代，历史学家只掌握描述分析已经远远 
不够了 & 在这种形势之下，我们译出本书，.希冀为我国史学二作 
者了解、掌握、 实践计量分析方法尽绵薄之力。 由于我: n 知识水 
平有限，疏漏和 It 误在所难免。恳请各位前輩、同仁不吝杜评指教 Q 

本书在校订过程中承章景琦、戴文同志热情帮助，在此一并致谢。 

1&87 年 12 月 
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yj^ 相 J~ ) ■■*+«** mm i-fe*4aa4B»4«« *«■ fe%«4 I# i44> *l*j^ ^ ^ ^ ^ 

】9 度纪中期地主在哪 M 生活有利可囹？ .（ U 1) 

收获馈改变了蚂？ .（1 H ) 

匍明书目. . 062 ) 





















绪言数学时代的历史学 


我们生活在数嗲时代。从20世纪初期起，数学活跃地深入到 
人类知识 的一时 领域，并不断地证实着马克思的论断 T 只有在成 
功池运用数学时，科学才算达到了真正完善的境地。”①现在，一些 
科学学科已经无保留地运用数学，而另一些学科则 刚刚开 始米用 
数学。历史学属于后者。尽管不少历史学家对于运用数学方法的 
前景仍感困惑，但是，现在大部分历史学家争论的问题已不是“是 
衣有必要运用数学”，而是 “应 该在什么方面以及怎样更好地运用 
数学' 

历史学家并没有 让自己 停留在怀疑和争论上 ，而 已经开始“运 
用”数嗲方法，并且积累了一定的经验。总结这些经验，对于同 
数学仍旧“陌生，抑 或已经 “熟识"的历史学家来说，都将是非 
常有益的。 

在开始了解历史学家所运用的具体数学方法之前，我们想首 
先阐明，在历史学中运用数肀意味着什么。 

人们往往认为，运用数学方法和电子计算机，不过是将在计 
算方面帮助历史学家 f 减轻和加快他们的工作。或苕，至多是有 
劢于更精确池反映历史学家的思想以及所观察到的现象。然而， 
运用数，方法的意义绝 不仅限 于此。 

如果注意考察苏联及国外苈史学家近年的经济史，文化史著 

①保尔■拉 法格： 《回忆马 克思: K 载《回忆马克思和思格斯》，莫斯科1956 
年，第66页> 







j 


作，注意考察历史学方面的社会学著作,会龙现，数学方法 
已影响着历史学家观察问题的角度和运用文献资料的方法，影响 
着他们对原始资料的收集和整理，以及分析这些资料的方向和内 
容。最后，数学方法对于检验研窕结论也有重要的意义。然而， 
运用数学方法最重要的意义看来在¥，它有可能解决使用习惯 
的、传统的历史研究方法所无法解决的某些难题。 

把视线转向数学方法，这就使历史学家“不能不"按下列步 
骤和方式硏究他们感兴_的问题 P 

〖 . 历史学家要筛选研究对象和准确地确定研究目的。在这 
里，研究目的往往以直接提出问飄的形式来表达。例如，为什么年 
轻人积极投身于俄国 W 世纪 7 0—80 年代的革命运动？为什么 18 世 
纪俄国物价急剧上涨？准确地提出问题，将明确地规定分析范围， 
并且给历史学家指明解决问题的捷径。此外，问题本身会激发思 
维本能地进行回答，这样的回答往往能够帮助历史学家迈出研究 
工作中最初的、通常也是最困难的几步。 

2. 其次，运用数学方法的历史学家应力求运用使研究对象 
能转化为数 M 形式的方式来表述自己将要研究的课题。为此，就 
要确定能够从数量方面说明所研究现象本质特征的指标体系。换 
言之，历史学家将依据前人的经验，详细制定或者选定必要的统 
计指标体系 。 例如，研究芥联工人在 30 和 40 年代的精神面貌，可 
以选择从数量上表征这一精神面貌的如下指标：教育程度；个人 
藏书量*闲暇时间安排；读15量；电影脘1剧脘的观众人数，等 
等0 

3. 历史学家在熟悉甜人著作屮有关该课题论述（如果历史 
编築学中记载了该课题的研究状况）的基础上，并依据经济学、 
社会 学理论或通常 碎看法 ，提出明确的针对该课题的工作铒设_ 
餐如，为了研究俄_革命以前从农村流入城命的移民的命运，历史 








学家提出这一假谠:农民在城里的 " mr 取决于年龄、性別、 
文化柅度、出身和个人资本*因第、提出这种 J : 作假设绝不会使 
历也7:家“分散注意力 '因为它使研究兴趣合理地约束在必须直 
接验证假设上 D 

4. 运用数学方法的历史学家不是泛泛 收巢 题的 
所 ff 材料，而仅仅收集那些对于回答具^^?^尚_以及对于验 
ffi 已提出的假设所必须的材料。譬如，研窃究资本主义俄 
a 农忖移民的命运，就要收集这些移民在城市的阮遇以及有关其 
年龄、性别、文化程度、出身和个人资本的材料， p 、 卩要按照历史 
学家的假设，收集移民命达巾最存意义的材料。 

5 .最后，历史学家要运用所收集到的材料验证自己的假 
设。如若衬料推翻 r 布关假设，如关于离乡农 k 命运取决于拟定 
凼素的假说，那么，对问题的研究便到此为止。如果不愿停止， 
研究杏可以提出其他解释，然后收集相柯的材料并重新验证假 
设。直到证明假设与 m 体 w 史事 劣完 全相符之前，这种做法将循 
邱往复。 

如上看來，运用数学方法的历史学家着手研究的起点就」; [通 
常的做法不同：不能从直接收集感兴趣问题的材料开始研究，时 
要从明确地提出 N 题、建立指标体系、提出工作假跺开始研究。 
这便规定了 W 史学家必须收集仆么样的材料，以及采取何种方法 
分析材料。在收集和分析材料之后，这些历史学家得出存义结 
论，然后再用一些具体历史事实验证这些结论。这种研允方法有 
网点明显地背离了分析历史规象的传统 做法： 萌究对象必须经过 
统计指标体系确定 > 在历史学家研究具体史料之前，己经提出 Ml 
供选抨 的不同解释。 然而这 种背离已被证明是正确的，因力它不 
仅在提出问题方面，而且在解决历史学家所提出的任务方面，都 
表现出精确性和明确性。按照这种方法进行研究的历史学家，通 



常用精确.的数量进行评述，因而很少使用诸如 H 午多’ V 很少％ 
"重要 的”、“重大的_ 一类使分析结果显得不精确的词语进行评 
估。这不无重犬意义。同时，我们注意到，精确、具体地提出问 
题和课题假设，述节省了历史学家的精力，使他们可以更迅速地 • 
达到预期目的。 

这种解决社会历史、经济史、政洽史以及虏支学 
科问题的方法的优点，在分析俄国统一民族市场问题这一实例中 
可以反映出来。 

益不多在80年以前，在《什么是人民之友？以及他们怎样 
攻击社会民主党 人?》 这一著作中，弗_依•列宁提出一个问 癦:统 
一的、全俄罗斯民族市场在俄国的产生和发展，是俄穸斯民族的形 
成、资本主义的发展以及其他最重要的社会经济进程所必须的条 
件。 ' 

革命前的历史学家，特别是革命后苏联的历史学家对民族市 
场的产生问题逬行了很多研究，但是，他们却始终未能令人信服 
地解决这个问题。关于俄围统一民族市场的产生时间，历史学家 
们就有三种意见： n 世纪、18世纪上半叶、18世纪下半叶。只是 
在最 近几年 ， 由于运甩数学方法，才使得解决列宁所提出的问鹿 
成为可能6在这里我们遇到一个可以用数学方法圆满解决的问 

分析这个问题可以分为五步：1 , 确定"统一民族市场 "的 
概念、特征、标志以及估计其犮展条件的方法 I 2/提出民族市 
场产生时间的假设，并査明什么材料，那些数量是解决问题所必 
需的收集爲休史料> 4. 整理、分析收集到的材料 I 5.验 
证得到的 结论。 

首先， ® 视使用数学方法的历史学家们力图精确地确立“统 
一民族市场”的概念按照他们的意见，统一的市场一这是一个 
共同形成的、统 j 的、完整的、联系紧密的地方市场体系。由于 






这种联系，地方市场价格协调波动或相互制约。如此定义民，族 
市场，故而珂以：第一，确定精确的数量标志用以估计民族市场 
发 m 水平，而地方市场价格你调波动的程度能够成为这种标志。 
第二， 寻求一种方法，能够从数量上反映这种协调性的程度 ，相 
关”（此词来自拉丁语 correlatio , 意为联系、相踽一 
致）方法正是这种方法。借助这种方法，^个、 球更秦的地 
方市场价格协调波动的程度，反映在表示\^关■时系 _ 數14上。这些 
系数條从 一 1到 + U 系数值越接近于1,则价格波动的协调裎度越 
髙。当相关系数绝对值高于 0.7 P 屯则可认力这种协调性达到较 
高程度了。由于釆用相关方法，在统一民族市场产生时间这一问 
题上，历史学家就存可能作出符合客观事实的回答。 

精确地确定民族市场的概念，也使历史学家有可能提出民族 
市场产生时间的假跺。由民族市场定义引申，其产生时间不可能 
早千^世纪。因为如 果迆力市场 价格具有密切联系，那么高水平 
的商品经济以及城乡之间和昝、地区之间具有密切的经济联系, 

就是必不 4 少的。由于我们注 意到； 直到 1754 年以前，在俄国内 
部仍然税卡林立，严重阻碍着商品流通；而在世纪末，俄国经 
济走上垄断的发展阶段，可以证明民族市场是否存在的上述两个 
事实，就把统一民族市场产生时间的上限推迟到世纪末至 1 BLU : 
纪初，下限划到 U 世纪末。 

研究的第三沙是收集材料。究竟收集哪些材料，收集多少， 
这完全取决于 K 族市场的定义以及已经确定的数量标志和课题假 
设。根据这些要求，研究统一民族市场的历史学家应该收集— 
1 9世纪这一时期 内以场 上这种或那种商品价格的財料。 

然后，根据收集到的材料，研究者借助相关方法确定在所研 
究时期内的各个时刻地方价格波动协调性的程度，完成这项工作 
之耵，历史学家就找到了统一民族市场形成的时间。经过计算得 





知，俄国统一的粮食市场形成于〗8世纪50—70年代，仝 K 族劳功 
力市场形成于19世纪末至20世纪初，等等。得出这两个结论的依橱 
是，18世纪50—70年代，地方市场粮食价格的被动开始紧密相 
联； W 世纪末，劳动力价格的波动开始紧密相联。 

然而刚刚得到的这个结论仍然是假设，还有街第 ip 少进 
行验证——证明它不是臆造，而是科学的。臂市场 
的发展，就需要验证在形成仝民族市场时期内具^经济效用的粮 
食运输的地理范围 & 我们发规，在 18 吡 纪50 — 70年代 劳动分工的基 
础上，俄国一些地区出现了从产粮区向缺粮的消费区的粮食运 
输。在这种情况下，_俄闰所有地区间形成了密切的经济联系。研 
究者由此有权断定，借助相关方法发现的地方粮食价格运动的高 
度协调性不是偶然的，而是存在于俄国各地区之间现实的商品经 
济联系的必然结果。通过验证，关于 18世纪50 — 70 年代形成统一 
民族粮食市场这一假设被证明是正确的 & 

由此可见，运用数学方法将深刻影响历史研汾、它将明显改 
变研究问题的方法，有肋于研究者得出更可靠、吏令人信服的绾 
论； 有助于研究者揭示事物之间的依从关系和发规事物之间的规 
律性。而这钱往往是使用传统方法难以做到的。综上所述，在历 
史学中运用数7方法的主娈 H 的和意义就是要精确和明确地提出 
问题，并且不仅从质的规定性方面，而且从董的规定性方而来解 
决间题。 









第一章计 M 就是解释 

历史研究中对质的辑 




质转 化为贵 

“如果您能够 m 数宇计 . a 并.及达您所说的事物，那么 ，您 就强 
知道有关这方面的某杩东 n in 足，如湛您+能对它们加以计 :ii 
并 ff 3 数宁加以表示，那么，您的知识就是浅薄不足的，19 iitm 末英 
国茗名学者开尔文的这…，句位得注泣，尽赞它冇过于绝 m 
，句荇 ® 表达 r 这样一个圯想：必须从数 _ fi 方面对客休进行研究。 

如果我们拋开开尔文上述#论的极端性 ，较 为冷静 
一冋题，就可以得出结论：从数 M 方 iM 对客体进行研究不圮.妨对 
其进 行质的 认识。毎一客 休都楚 质与 a 的规定性的统一体，因 
此，在既相互联系、常常又相互转化的统一体中研究某一客休， 
乃足最济訂成效的。这一结论足否与本章的题0 “计 M 就足解 
释”相矛盾呢？ 一点也不。囚为，如果被研究的客休不能 
示”其数帒特征，并从数7涵义的角度加以 H M ， 那么，对这一 
客休的了解就是不完全的。止因为如此，现代人文科7领滅的研 
究莕们，特别是社会学家和心理学家们，开始愈来愈广泛地运 
定贯分析。 

为了对质进行计 a ， 或更为确切地说，为了 通过定 m 分析揭 






示客体质的规定性而确立的诸多方法的发展，在实践要求的影响 
下，甚至导致产生了一门新的实用数学学科—质的定量鉴测 
(这一术语的字面之意即“对质进行计 M ”）。 即便是历史学家们也 
Q 走上了这条道路，因为他们也已得出 结论： 对于最复__放@史 
现象及过程，至少就其中的许多现象和过_来说 r ^ lS $ oy 狴 
标志，从而以鲎的形式揭示这些现象或过赓 

对质进行计 S ， 除去其一般的意义，即除去保持对客体的完 
整认识外，还有其实用意义：历史学家可以运用数理方法分析那 
种可以用量的形式来表示的事物。因此，在运用数理方法研究具 
体历史衬料时，通常要预先把它们转化为量的形式。将质转化为 
量的工作非常有趣且引人入肶。但在我们讲述如何做这一工作之 
前，须就历史学家的原始栻料，即他们所运用的枋料说几句 & 

我 n 说，历史学家在原始枋料方面不可能象物理学家或化学 t 
家那样苛求，因为，历史学家自己并不能创造史料，而是不得不 
满足于前人遗留给他们的东西，并以 最认眞 的态度利用过去保存 
下来的一切 a 这摆原始且粗糖的历史材料并非经常以量的形式 m 
现。原因在于，第一，在19世纪以前，人们较少且不善于利用数 
字记载所发生时事情；第二，大多数原始状态的历史事实和现象 
实质上也不可能直接以量的形式出现。因此，那些研究宗教、社 
会、文化、政洽史以及国家机关、战争、改革和革命史的历史学 
家们，大多是与质的特征打交道 

“特征”概念在后面将经常用到，因而有必要予以确定。特 
征通常被理解为客体 （ 现象）的属性、典型特点或特殊性 & 量与 
质的特征有所不同。败蛋特征具有直接的量的表现形式，即自始 
就表现为一种量的形式，如人的年龄、商品的价格贸易量的大 
小等等。而一种量的特征的各方面意义又因一定的大小而互有区 
别，比如，人的年龄有从0到150岁这么多意义。质置特征与数量 








特征不同，它不能直接通过数跫表规出来^>因为，质 M 特征的符 
方面意义并不是根据 S 的大小来划分，而是因质的内容而 相互区 
紐 U 比如， 革命前俄闱的各个等级由于各 Q 的权力、义务和特权 
不叼而 K 別开;那种只 Yi 两种对立的意义,二者_必择 f _的特 
征，如识宇者或文宵，学生或非学生，则是质 
的特征的各种变异。 

历史$家们不得不主要分析质的特征，因为他们主要不是 m 
数？ V 而站帀语言、概念和范畴进行工作<> 在研究18世纪俄国文学 
的过程中，我们常碰到库里宾、拉斯特列 m . 拉杏舍夫、罗科托夫、 
迖什科妹的名字，而我们并未借助数字记载使知道了他们的活动。 
在冇关 W _20 世纪初俄国农民阶级斗争的著作中，一般来说，有很 
多关下这一斗争的进程及性 m 的有葸思的描述树料，而有关量的 
特征犲料 w 较少。在有关苏联对外政策的著作中，我们则经常 
读到，某一政策是爱奸和平的，旨在消除国际紧张琦势等等。同 
时，苏联政府的有关文件及和平法令则常被引以为证。在有关苏维 
埃政权初期苏维埃人民委员会工作的著作中，为举例说明这一委 
R 会多方而的活动，经常援用许多法令，这呰法令的目的在于便 
m 家机关的工作适应社会主义建设的任务。 

但历史学家们对语言的偏重并非总是出于必要。由 t 习惯和 
竹统的原因，他们舒常以叙述代晋数量分析。上而捉到的那些内 
转，用语言表达确实比较 简易、 比较常见， n 足，如果历史学家 
笮 握了数 m 化的艺术，亦即茜于 m 数量表达，并试图把一些本质 
特征鹄化力 h 〖的形式，那么，数表同样能给历史学家以极大的帮 
助。为了证明这种轺化貝 k 能，我们不妨考察几个具 I 本实例 a 
^13阯纪侬罗斯文化”这个复杂概念可以分解成几个能用数 
坫表示的因索。 I 匕如，这些因素可以是识字率、教育程度等等， 
而这 a 因素可以偕助于数据，诸如识字人的数量及百分比、各类 




7 校的数量和各阶 Eft 校生的数额来表示 P 书 、报、杂志的份 
数，他们的价格和流传， 乃至对 出版文献的题_内容的数 M 评 
价，杏明有多少书籍或文京论及革亊或戏剧等等，这些将会使历 
.史7家知道俄罗斯人对文化知识的欲塑，知道俄罗斯人的眞神需 
求和兴趣。 

地主农奴对农奴制的态度也可以 

不是仝由筲先，可以对农 R 骚动、上诉、1跑以 及其‘ 阶级 
反抗形式进行统计。其次， W 以对上诉、呈文以及各种政府文 
件的内容进行数量分析。利用这种分析方法，便能发现_农民对农 
奴制的态度有二种：要么持较为消极的态度，要么相反，带有同 
地上斗争的战斗性态度，或者只足"一般的”、“中问 w 性的故视 
态 度。骚动、纵火和其浊反抗形式的多少所反映出的 农民间 他 i 
相 m 家相万.关系上的某种紧张程度，将与上述三种 "边界 点”相 
对应 a 一且完成了相应的统计，我们便会得到衡 a 农民对农蚁制 
态度的尺度，并4据此指出，在发生多少骚动的情况下可以认力 
他们之间的关系是极度的職，或是中度的、低度的敌视 D 利用此 
种方法，就冇可能对阶级斗争的强度以及农民对农奴制的态度进 
行 iH 

象苏联对外政策这种历史现象，也有一系列数：！当量 ， mu 
和平建议的次数，顶防发生觇 ■> 冲突的照会的次数，苏联 和外国 
领异人各种会晤的次数，等等。 

十 )1 革命胜利初期的苏维埃政府的活动同样可以从数 M 方而 
子以描述。为此，历史学家须芥淸，人民委员会在多少时间内讨 
论 r 多少次有艾工业、运输围内战争前线的状况，发布了 
多少法令、 通告笮等。对政治.经济和其他种种间题的讨论次数 
能够帮助我们佔计其迫切性， ㈣ 时从数 M 方面描述列宁领导 K 的 
.人民委员会的活动 P 

i 
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甚至象俄国农奴制农民对劳动备 h 的形式的 
可以——尽攸只是简部的一 c 包钔谚语和 
俗诏集）、农 K 的吊文及上诉的数最进行分析，进而给予统计性的 
描述 。比 如，对农贼以丧达劳动是愉快的还是痛苦的、适必须的 
还&上帝的惩罚的那语及俗语迸行数發统 iW 就能丧叫农 K 
对劳动的态度是消极的坯足积极的，他们对劳动是关切还是冷 
m 在估价一组特定的谚语和俗语在关 r 劳动的谚语和俗讯 总谭 
屮所&的比® u ，历史学家就会得到判断次民劳动操行的某种根 


观在，我们试对上述_托个例子中将质 : m 特怔 较化为数玷形忒 
的方法作一总结。实现 这种轺 化有^种 方法: ii 算、统计计 s 和 
把各种臥着的概念化整为零。 

对历史#实在吋间利空间范固内逋复出现的次数进行计算， 
乃义将质•歎特?.[ I :匕为數•緊形式的 M 没逋的 方法。比如， 我们汁 
苋过农 K 运用谚 语的次数、农 K 骚动的 iX 数、工人罢工的次数， 
等气、 「! m 卜算 /被分析的事物特征的重哀次数，结果，诺如对 
外政策、政府活动、农奴制农 K 对劳动的•态度:等许多复杂的杜会 
现象，就有 y 毡的规定性。 

$计讨置的方法相比如，我们统计讣最了农民对农 
奴制的态度——农 E 对&奴制的 練 或足敌视、或是中立、或足赞 
成；以及1 8世纪依国社公的文化水平 —— 1 S 世纪俄冈识民的一般 
文化水平可以是说的、低的或若足中等的。在前一种 W 况下，将复 
減社会观象较化为数 M 形式的裎序是碗定农民对农奴制态度的 
“边 界点％即敌视1中立和赞成，并为这些"边界点”寻找数贵 


对1 s 肚纪俄 转化为数 m 形式 
的 K 序 就不同 了。接进行定量分析 & H 

k 鬼劇 一 d 











此， _ 我们必须首先翁嗔/分解 w 为个别的因 

程度等等。只有在为估价这些因素而采用某种 尺度宽 标准后，才 


能用数量加以表示。 

由此可见，对大部分历史现象均可从 T 面两个角度进行描 : 
述：或者从这拽现象在时间或空间范围内重复出现的次数的角度 


( 这吋可以提问：多少次？），或者从这些现象的水平和强度的角 
度 （ 在这种情况下可以提 问：水 乎怎样或紧张程度如何？）。这样， 
各种现象就都能用数量形式加以表示了。 

有搜历史现象可以从时间延续的角度进行描述，如战争和经 
济危机持续的时间等等。另外一些现象则可以从空间延续的角度 
加以描述，如铁路的长度， 产品 销售市场距产地的距离等等 ，定 
量分析在所有这驻场合都是较易进行的，而且历史学家们在这拽 
场合也常乐于运用定量分析。 

还有许多历史现象可从结构方面进行考察，这种结构是能用 
数量来表示的 & 如苏联的社会结构、国民经济结构、贸易结构等 
等 6 在苏联史学中，一个迫切的问题是弄清 16— 20世纪期间俄国 
农民的社会结构。如果历史学家们按照不同的标准划分农民经济 
集团，便可发现各集团的比例，并能在此基础上确定农业中资本 
主义的发展水平。 

以上分析证明，对质的特征进行 统计计 量是非常细致 而不易 
的，但又非常有趣并富于成效。历史学家将揭示出那興被忽视的 
现象的新面目。如同那些用灵巧的双手把金钢石变成钻石的珠宝 
匠一样，历史学家将迫使事实“显露”出其所有方面，并从中找 
出它们所能贡献给科学的东面。 

把质的特征转化为数置形式，这要求研究者透彻了解被研 
究的具体历史现象，同时知道如何寻找这些现象的量的规定性 & 
为了解用数理方法研究复杂历史现象的复杂性及高度有效性，我 

rf 
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们 观在来看二个实例分 析： ‘災:，分粮食价 
格上涨的态度，其二，分析 i9i 7— 国民经济委员合 
(BCHX) 衲活动；其三，观究16_ 2 0世纪俄■统^的民族粮食 
市场的发展。 

18 ft 纪的俄国人怎 样濟待 
涨价的 原因？ 

1767年，对全国物价猛涨感到惊慌不安的俄国最高行政:'_1 
局——枢密院，曾就粮价昂贵的原因问题向全俄各县分发了一份 
秘密调查表，包括14个 问题： “1 .为什 么县里 歉收； 2 .或杏为什 
么农民减少了； 3 .或者为什么甚 里人口 增多了 i 4 .或者为什么 
土地闲置而未耕种； 5 .或莕为什么经济农奴或原寺院农奴在实 
行代役租后没有放弃耕地； 6 .或者歉收是不菇 因为十 .地耕作不 
良或施肥不茧； 7 .或者牲畜中发生.瘟疫是讲多 T 往年'等等。 

各地对上述调査表所做的答笈乃是经济史以及社会史方面颇 
具价值的史料，因为在这些答复屮反映了18世纪下半叶俄国人在 
一个重要问题上的认识。显然，了解纪 60 年代的俄同人对物 
价上涨的原四这一重要问题的意见和看法，对历史7家来说具冇 
极； K : 重大的意义和价俏，他们可以根据各地的答复，考察$时的 
文化、教育和科学水平，考察人们的成见以及各阶 S 之间的哭 
系。此外，他们还可以从这些答复屮得到大量有关 1 S 世纪中期褓 
闺人经济、生活和风俗方而的惜况。这也就是^为什么历史学家屡 
次整理对枢密院矣査表的昝复。但只对每一个别的调查表内容进 
行定性分析的传统方法并不能使其中的资料得以完全利用 s 如菥 
对调查表的符复进行统计忒的研究，或 从量的方面 考察18世纪俄 
国人对物价昂贵的意觅，那么历史荦家就有可能获得大量有关我 


U . 







軻痉济及当时俄崮人认识方而的信息。 

对年枢密院调查表所做符复的旭形不能进行统计研究， 
因为它们模糊不湞，其内 W 也驳杂不纯。比如，阿斯特拉罕省锊 
饺对调査表前7个问题的.答复 如下： 

1 .在阿斯特拉罕锊，粮食 屮产质 SU 卩不尚。 

2 . 当物价昂贵影响到粮食价格时，贵族知识分予和小商人 
中的许多人开始从事耕种，因为他们认为这比他们靠蕲自己的小 


额资本从事其他买卖能获取更多的利 润。 

^ .虽然在萨抆托夫和察里津因移民到来致使识民冇少量增 
加，似仅此一点无论如何不该影响国家的最 )5 结论。 

4 .加上所说，如今那 m 的耕地增加了，但适于耕种的耕地并 
没冇空闲，而大量的空闲地所以空闲乃是缺少耕作者所致。 

5 .全错没有经济农奴，关于他们不叫能有什么说亂 

6 .部分由于耕地贫瘠，或山于不给土地施肥，也许很禅易造 
成今天的物价昂贵，因为所有的耕地年复一年地耗尽了地力。在 
我国火部分地区，不给土地施肥，并非因为缺少粪肥，主要是因 
为一种古老的习惯，这乃是这一后果的最一般原因。 

T * 假如瘟疫致使牲畜减少，伹那里的瘟疫并未比以前更多， 
所以这不可能是今天物价吊贵的原因。 

对调查表的答复是不明确的。原因在于 t 调赉表开列的间题 
并未预先充分规定对14个问题中任意一个问题的不同符案 ，从而 
为被调 ft 者留下了某种0由。为了能妙对调迤丧 iLt 行统计研究， 
就；耍把问题和答案置 T 吋比较的同一形式中，也就是要形式 
化。为此需要在认真了解调查表屮每一问题的材料的基础上，拟 
订金部可能的矜案，然后再把对全部问题所做的每一答复“归 

这些答案中，最终，我们就能对各个答案进行分类和计贵 
To 比如/酿酒北是否比以前增多了，尤其是因为贵族不时居于 
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乡 K , 同时利 }_H £ i 己供职的特权而使之增加了？ '对这 -一问题吋以 
心7 祌饩衆:1 , 业增加了，而 IL 成为了粮价增长的原因; 

2 .酿洒 业并北物价昴货的原 W * 3 . 酿酒业增加了，似并不是价 
格上涨的拟因； 4 . 酿酒业减少 n 5,酿酒.收仍悴留在以前的水 
平上； 6 . a 里没行酿锕 I ; 7 . 边 m 没有酿納业， w 为丑甩没冇 

餓 ( kkr：r * 个答案菇卩4为只准贵族酿酒）。对釀 
一种答复可以 归入 上述7 fl 『答案中的一种。对獅 
分类，得出 如下 结果：有25张踽杏表，或者说藏的 调杏表 认力 
酿洒、 ik 是粮价增 Lt 的原丙；必 U 张调查16或者说7够的调衣表 
认为酿涧业不足仿格上涨的原因，等等。 

利用上述方法对1 T 6 7年调.查表的答 K 迸行加丄，之耵就減 
将 K 中含有的大部分数揣。此外，还可把这些数据根据内 W 列成 
闻 犮，这对 FIG . fijfU 非常方俚。由此，惝国人対物价印炎问题 
的这 见便获得丫它的试 A 表观塔式 （ 餘 o 。 

对 i 7 6 7年枢密院调 fi X 的答复进行的统计整理说明，按照， 
时俄闪人的沿法，粮价上涨的 「 K 耍原闪是歉收，74场的调杏衮这 
mk ； Jj . *18 世纪60年代的侧人呑来，粮 价增氏的次® 龙原 
W ， 足人 U 和购买锒食的人数的增多，以及与此相应的生产粮食 
的人放的减少 （ 2 S 璐+ 1 9噁=47螞） D 由此，观代人就可以/解18 
世纪隅围城节和丄 I 发 M 的进程以及城市和工业居民的增长过 
程 .] 俄国人把价格增长的第 :_r: 位原囚希作是人 t - l 密度的壻加 
0 5费） ，戍# 按照他扪的说法，是里人口的增加'最后,:作对 
调查农的 M 题的答釔屮还 指出: 价格增的原因还在于酿洒 .仆 .的 
增 K ( U 唤）和粮贪投机 （ _)。 

■ i 4位打忾你仏为，粮价增长的原间是农民玩忽叭分和懒怡 
对池方行政机关代丧的这种 i 兑法应 r ■保留。哲辑——沙 . a 政府在 
地方的支往和辿上的保沪#——把农奴制农民 缺乏为地主劳 动的 
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表 V 对年枢密院调查物价上涨庳頃的答复 


I 调査表数苽（祚 


i 绝对数宇 1 % 


歉 收. . . .. . . ..……… 

商品粮消费者数量增加 .. 

农民弃农从箏捕盘、经商、打零 T .. . 

居民数常增加 

酸 . . . . . .. ... 

粮食投机… .. 

农民揪惰 .*. . 

教会土地世俗化 . . 

m 食收获■:下降 . 

有些耕地未能利用 *.*.*. 

农业技术落后” . ….■…… 

. .. . 
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兴趣看作是懒惰 g 正因如此，应该把总督称农民玩忽职守看作是 
农民反抗和保卫自己不受地主剥削的一种形式。 

在 is 世纪⑽年代的俄国人看来，粮价增长的次要原因是教会 
土地的世俗化 （ 6 势）；粮食产量下降 （ 5势）；一些耕地未能利用 
( 4 灸）;农业技术落后 （ 4 钧）；最后是粮食出口 （ 3势） 。一 般来 
说，由于被调查者同时指出了物价上涨的儿个原因，因而就各个 
原因所做笞复的总和便超过了调查表的总数。 

如上所述，对 I 767 年枢密院调查表进行统计整理 ，使历史学 
家得以发现了俄 m 人的概念、意见这类复杂现象的遺的特征。通 
过对每一个互不联系、没 有贾的 规定性的个别答复的统计，就完 
成了对俄国 A 意见的"计量\ 

饶有兴趣的是，调査表作为收集材料的方法，早在牡会学产 
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*之 前便已出现，而绝不愚 20 世纪的特权 & 尽管 18 世纪的“社会 
学家不象现代研究者那样 在调查 方面如此细致，但他们在研究 
大众注意的问题时，则表现得富有技巧和机智。除上述调查表 
外，另外一些涉及 18— 19 世纪的重要社会经济问题的调査表是众 
所周知的。为了研究对这些调查表的答复，可以运用研究 W 67 年 
枢密院调查表的答复时所运用的方法。 


数字中的政策 

现在让我们来看看，怎样从数量角度描述 m 7— 年最高 
国民经济委员会的活动。在苏联历史文献中，就象其他政府机关 
中一样，最高国民经济委员会的活动通常可以用两种方法进行研 
究:分析决定最高国民经济委员会每一阶段任务的正式 法令； 或是 
描述最高国民经济委员会的最主要决定。但是，通过上述两种办 
法并不能确保最高国民经济委员会工作的总体性。因此，还可以 
运用第三种方法，即对最高国民经济委员会的记录进行综合统计 
整理。这一方法是在20年代由中央统计周国家统计司创立的，不 
久便被莫斯科的历史学家3,德洛比热夫所运用。① 

对最高国民经济委员会活动进行统计整埋的实质可归结如 
T : 酋先，将最高国民经济委员会在1917—1929年的每一份记录 
按照各次会议上所讨论的不同问题加以分类。如拨款、制订计 
划、地质勘探等。还可以把每一个这样的问题列入一个苹独的卡 
片。然后再根据三个确定的任务对记录在卡片上的问题进行分 
类 ， L . 最高国民经济委员会职能工作研究（在这种情况下，可根 


① n 褴洛比热失: 《 对显高 m 艮经济委贝会记泵进行统计硏究的方法 U 917 
--192? 年 ） 》, <莫斯科大学学报 196 S 年第3朗。 
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ft ; 所讨论 N 题的性质、工人的 工资、 安全技术、工业国有化等等 
进行分类 ）； 2 .搞淸域高国 K 经济委员会对各工 业部门 注意的裎 
度 （ 在这种情况下，可按部门特征"一采矿业、冶金业，食品工 
业等等，将记隶委员会讨论问题的卡片进行分 类)； 3，确定最高 

经济委员会对 全国各经济区 工业情况注意的程度 （ 此时可按 
经 济区对 卡片分 类）。 

由于做了大量耐心的工作（可以说洋尽分析 
并在卡片上分记了约11 00 Q 个问题），从而得到了 &述〔^7—1929 
年间最高国民经济委兄会每年在三个方面的工作材料：最高国民 
经济委员会决定的问题、它对个別经济部门的关注以及对全同各 
经济区的关注。所获得的材料反映出最高国民经济委员会活动的 
过程及其变化，抱出这一点很 M 耍。表2清楚地显示了对最 K 国 
闰经 济委员会主席闭第一类的记录进行综合统计整理的结果。 

表2 对最离围民经济委员会主席团讨论问题的统计分类 

1917— 1918年 | 1 SH 9 年 盤个 

— -,- [ - — I - 1 - 1 - i 9 iT — 
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报椐攻 _ 2 的材料 ， 我们可以确切研究最商 ㈣ 民经济 委员金在 
1917— 1929年间对各种工业问题的注意程度以及它是忠样 变化 
的，可以搞 W 楚什么问题在什么时 候是特 别尖锐和迫切的。 

对 最高 W 民经 济委 Q 会记泊进行统计整理的结 Jli ，清楚地表 
明它对这一或那一工业部门以及对国家各经济地区注意 程度 的# 



化，以致椐此可 
动中所占的地位。 


这样，不适用一.般的、模糊不淸的评定全 面的％ “屯要 
的，， 活劝/大的贡献”等等，不是对最商闺匕经济委员含工作的 
这祌或那种事实进行简单评述， 而凫通 过性质分析勾划出了： 

同民经济委员会活动的迤丰趋势， 然后洱 对其加以数评价。对 


设高 N K 鲐济委 M 公记录的统计整理使得可以全而认真分析 w i 7 
— 1 9扣年间社会主义工业总指挥部的活动。 


实阮 h U 均可计量 


对] 767年枢密院调 杏士的 答踅以及对 i 91 7—1犯9 年间敁 高 W 
民经济委 r ; 会的记录这两个实例所进行的分析可以极好地证明： 
对大量非统计性史料进行统计加工是可能的。在对同一类事实、观 
象，一堆语言矿石”进行统计 之后， 便会出色地将其变为严格的数 
灰，史料的内容浓簡其中。这些数字可以使历史学家日后根据研 
知任务并按照自己的观点“支配”史料的内荇。 

实际上,我们可以运用计星方法研究各神最复杂的问题，只 
要这鸣问题能够归入“姑一问题”之下，能分解成一些平独的问 
题。对统一的民族市场这类复杂历史现象的:分析便是一例。 

我们注葸到，凫说到统一的民族市场时，须注意各地方办场 
汕密切的相互联系，正是这些地方市场组成丫统一的机体和整 
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休。统一的民族市场源于社会劳动分工以及在此基础上国内各池 
区之间贸易和经济联系的发展，它是通过合并和联合国内各地的 
市场而形成的。我们看到，统一的民族市场这一定义在数量上 
是不确定的。但: S ：， 如果从中分解出一些单独的成分（因 素），其 
中毎种成份均可单独进行数量估汁，那么/市场” 



了量的规定性。 


从“民族市场”概念中可以分解出五种因素：1 会分_ 

工I 2 .国内不同地区在一定商品生产中的专业化（劳动的地域 
分工 ）1 3 .生产的商 异性 M .各地区的商品经济联系！ 5 .价格构 
成。现在让我们按照其中每一因素对民族市场所具有的意义来澄 
清所分解出的各因素间 的相互 关系，市场 w 概念的主要 B 素或内 
涵是商品经济联系。其他三种因素一劳动的社会分工、地域分 
工和商品生产，则对上述主要因素 起条件 补充作用，因为，没有 
后三种因素，闰内各地区之间的商品经济联系的发展是不可能 
的。而价格构成，就其对主要因素的关系来说，应诙看成是一种 
后果， 因为一定的价格构成的形成，乃是各地区之间存在的商品 
经济联系的结 

对“统一的民族市场”概念的所有因素均可进行数量估计 & 
比如，商品工业的联系可借助于“运输的地理距离”指标从数量 
上加以表示，而这一指标可以用货物重量与距离的乘积得到 确定。 
劳动的社会分工则可以措助于人口学的材料，即按照工作和职业 
把国家和个别地¥的工作居民分类整理，从而賦予其量的形式， 
在某一国家的某 j 历史时期，职业的构成愈是复杂，那么，这一时 
期劳动分工的水平就愈高。劳动社会分工的另一个标志是每一个 
人通过私有家庭经济或莕社会经济未满足自己全部需求 （ 商品， 
服务 等等） 的比重 & 为出 a 而生产的产品的份额，或是这一地 
方和地区为社会需求所进 a 的产品的份额，则可以看成是劳动地 
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域分工 的标忐。农业 、手 工业和工业的商品性质则是“商品虫产” 
因素的明碰标志。对地区的价格构成 * 我们可以通过两个标志来 
描述：地方市场价格波动的协调一致程度以及这些价格统一的程 

度。 

这样/民族市场”的概念最终得以分解”成了一些 i 独 
的1其中每一个均具有量的规定性的因素。通 
的这些单独的因紊进行统计计量，我们就可以运_齋量方法来分 ; 
析市场。 

我们在考察一个具体事例时，一般是尽可能使复杂的概念具 
有量的规定性。程序分以下四个阶段。在第一阶段，研究者要确定 
研究的对象并使其具有确切的定义，这一阶段可称作概念分析或 
楚理解分析。在第二阶段，研究者要将这种被明_的研究对象"分 
解"成各种因素或成分。研究者须通过逻辑途径一一基于经济学 
或社会学的理论——提炼出这些因素并考察它们在实际中的相亙 
联系。被提炼出来的诺因岽的总和可以提供被研究现象的系列标 
志。 各种因素的数量依某一被研究对象的自然属性和炱杂性而变 
化，而且这些因素可能有许多。因此，在程序的第三阶段，研究者着 
手对在第二阶段提炼出的各稗因素进行分析和精选，以备以后利 
用。为此 g 的，研究者需要根据各因素与被分析的对象（这里指 
的是 市场） 的关系裎度，在各个因素之间确定某种比例关系以及 
一定的从属哭系。最后，在第四阶段，研究葙就可以对精选出的 
各因素进行个別计置了。 

把一个复杂槪念转化成 E 的形式的全部程序，其实质在于， 
要从这一概念中区分出一呰可以用数量表示的因素，而后对其迸 
行汁 最以便于日后运用数学方法。 

现在，我们试做一下总结。在历史研究中，数学方法仅仅可 
以用 来研究那些可用数量表示的材料。但是，历史学家所要分析 
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的人多不特征，而是喪.分祈那种没有通川成规范 计 U 标准 
的质的特征。 W 此，将质的特征转化为足的特征，乃足利用数学 
方法进行研究的必要前提。实现这种转化有三种方 法： 计数，对 
质的特征进彳 j 统计计量，以及把一个夏杂的概念分解成一些单独 
的因素。通过 计数， 研究者可以得到被分析特征在时间或空 ㉟ 
复的频率 （ 比如对枢密院调查崁及最高闽民经济_员-研\ 
究）；通 过计量程序， 被分析的 特 征就有了在一定 fa 


m 的丧现形式 （ 如对农 k 对农奴制的态度以及阶级斗争紧张程度 
的计量 ） i 可以借助于计数或统计计量把一个复杂的概念分解成各 
祌因素，从而便每一因素: K 4/： a 的规定性。有时，一些因岽还可 
以 n 接用数衣活。 

必须强岡指.出，对掘切史的具体的质的特征进行统计计 
- M ， 这主要不姑一个数学 M 题， I 衍是一个逻 辑历史 问题，因为质 
的特仳转化为敏壻形式首先 Yj 赖于被研究现象的内容和质的 规圯 
性。因此，在很大程度上，历史学家所提出的计量标准乃足对该 
观象选行富冇内容的、本质的具体历史分析的结果，而不是进行 
统计或数学分析的结果。这也就是为什么历史学家常常必须根椐 
被研究现象的本质来 想象 并设计反映这一现象本质的标准。因此， 
尽 t 对质的特征进行统 mhM 遥按照一定法则迸行的，但它却是 
—项创造性的工作0 

“算一算，这在嗶里是可能的 r —— 世纪英阐若名心理 $家 
弗朗两斯 ■ 尔顿的3艺一警句成该引起历史学家的注意。也许不 


必逐字逐句地听从他的这一呼吁，即不必象高尔顿那样，來在教 
室甩，计算教室 m 的咳嗽声和骚动不安（窩尔顿以这种办法佔价学 
生的注®程度）；散步时，计算在路上遇到的女人中杂多少姓漂亮 
的，有多少相貌平平，有多少宂全不漂亮（高尔顿用这种方式为英 
h 《美女肖像》杂志收集材料），等等但是，算一箅是耑要的。如果 
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历史学家都能更多地算一算，那他们在研究工作中的成绩必 将史 
大。 



’但是，表现为数量形式的材料的存在，并不能倮证它们的可 
靠性 ^ H 此，研究者应仔细检查这些材料的 “ 可靠性 '对 这些材 
料进行检査的结果几乎总是暴露出收臬到的材料有许多缺陷。只 
有在检验之后，历史学家才能决定是赉可以在这些材料的基础上 
进行分析。考虑到这一点，历史学家必然要提出问题 I 一般来 
说，什么栉的材料可以认为是准确 m ? 由于要用数学方法研究以 
数量形式表示的材料，所以，我们在分析统计材料时应反笈考虑 
这^问题。 

“什么样的材料珂以认为是准确的这一间题不吋能绝对明 
确地解决。既然对可靠性的要求是随时间发展而增板的，而后来 
出观的栻料的准确性通常又是比较高的，所以材料的准确性只能 
是相对的、历史的^ 

就准确性而言，历史科学的材料与其他学科的材料相比，既 
有共同点，也有特殊性&共同点是：因为观察错误或片面，或者 
因力选择错误和缺少一呰明确的定义和分类,有关被研究现象的 
原始枋料在准确性方面有不可避免的误差。这类误差与科 学发展 

的水平 有关。 

历史统计树料中的特殊性则在很大程度上与其社会、经济性 
| 有艾。特殊忤可以归纳为以下三个方面：1 •时间和地理范畴的延 
续性； 2 .收集和传布材料的人寻找材料的动机> 3 .这些材料大 
多莛私人或政府活动的副产品，而非事先计划实验的结果 。 以上 
列举的历史统计材料的特殊性，在很大程度上还是由历史科$本 
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身的特点决定的，因为历史科学是研究过去多 少年納 寧件纟这就降 
低丁历史材料的准确性。现在我们来详细谈谈历史统计材料的特 
殊忭。 ^ 

如果历史统计衬料能够跨越长久的时间广■僩■煎那辑 
是特别有益的。因此，历史学家通常总是努; 學 时 间或空 
间范畴属同一类现象的材料统一起来。如每10 者年、〖 ao 年、 
200 年或更多年间的粮食价格、收成、贸易额1 居民生活水平、 
农民賦税数额，在某一地区或全国范围内农民骚动的次数等等。 
但是，3统计数列具有很大的伸缩性时，则构成这一数列的材料 
一般是非同类的。因为，这些材料是根据不同的方法和分类 ，根 
据不同的手段和由不同的人收集并自然形成的。通常，历史学家 
难以知道不同时期的统计材料是怎样获得的，以及能在多大程度 
上保®这些材料的可比性，这就愈发加强了材料的非同 类性。 

历史统计材料的第二方面的特殊性在于，这些树料从厲于社 
会经济范畴和人的活动，从而直接涉及他们的利益。因此，与自 
然科学的材料不同，社会经济统计材料常常被有 意伪造 。由于收集 
或传布材料的人总要隐瞒或歪曲某些材料，因而产生了材料的虚 
伪性。这样做的动机可能各不 相同： 有的是为了减少税收而使政 
府机关产生误解；有时是为了粉饰太平或欺骗竞争者 I 有的则是 
想利用收集到的材料来论证某种政治目的或是论证自己建议的正 
确性等等。但无论是收集材料的人还是传布材科的人，他们对准 
确性的利害关系都无条件地反映在这些历史统计材料中。 

在按照两种不同的原始材料整理出的有关190 0— 1908年德国 
罢工运动知统计枋料中，我们可以清楚地看出社会学统计的偏: 
颇 〆 

由以下紂料巧以看出，对同一现象， 统计 数字大相径庭。根 
据工会的材料，工人们自卫比进攻多#而拫据在宫方统计材料中 
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迸攻性罢工 *. …… . 

以工人胜利而结束的罢工 . 

以工 人失败而结束的罢工 . 

I 有妥协结果的罢工 . 


宫方统计工会的统计 


( 9& ) ' 吻） 



反映出的企业主的意见和看法，工人们主要不是自卫，而是提出 
不合理的要求， 即 进攻。从工会的观点看， 大部分 罢工是工人取 
得了胜利，而在企业主看来，则工人在大部分罢工中遭到了失 
败。 

历史统计材料的第二个特殊性与下面这种情况相关，即这些 
材料几乎总是被莱一位收集人 事先准 备好了 。 历史学家并未参预 
这些材料的收集工作，更没有检验过这些材料的质量。因此，研 
究者常常既不知道对那些原始材料进行收集和整理的方法，也不 
知逍收集这些材料的条件 a 结果，对在历史学家之前形成的资料的 
准确性和可靠性进行估价便遇到了无法克服的困难，因为历史学 
家不可能重复收集挝料的过程，以便提高或检验这些资料的质量。 

从上述历史统计枒料的特殊性中我们可以看出，历史统计材 
料不可能绝 对准确 。的确，在历史学家或经济学家对 保存下 来的统 
计材料的可靠性进行检验之后，他们就会发现，某些材料在某种程 
度上是不准确的。比如，对19 一20 世纪初俄国粮食收获量的统计 
的检验表明 Y 省松们的报告降低了收获量。而在农 业司的 统计材 
料中，收获^则又过高。对19世纪俄国对外贸易官方统计材料的 
准确性进行恬价后，人们得出的结论是，贸易额被过分曄低: 
一些著名的统计学家，如 A _ A •拉 齐格、 M ， A . 西里诺夫、 A * 


25 






















福尔图纳托夫 、 B - II •波 克罗夫斯基等人均曾指出过，在20 
世纪初的各种史料中，涉及农业、财政和其他许多问娌的统计材 
-料歧异甚大。 

资料不准确是各国统计的特征。比如，西+ 著名氧 
摩根斯特就曾估价过 so 世纪发达资本主义国家材料的 
确性。他对有关对象的不同原始材料进行了耐芯€较，从而得出 
结论，原始材料中出现的误羞，在对外贸易方面达16势，在价格 
方面则达100痴，在采矿工业中达31钧，在农业中达50%，在就业 
方面达30够，在失业方面达50势，在国民收入方面达50%。① 

由于原始统计材料中存在着不可避免的误差，因而产生了一 
个问题，在人们继釀整理、总结或归纳材料时，材料的误差是否 
依然存在或是否相互抵消了呢？ 

一些研究者指出，随着统计材料数量的增大，大部分误整的 
影响趋于减少，因为在很大程度上，人们得出的某一结论是指相当 
长的一段时期，原始材料在一方面的误差会被相反一方面的误差 
所平衡，也就是这些误羞相互抵消了。与此相反，另一些滸究者 
则认为，实际上，所有原始材料的误差是累积起来的。 
v 但须指出，上述两种观点都是极端的，它们不符合在归纳材 

料过程中各类原始村料出现误差的实际情况。问题在于，原始材 
料中不可逾免的误差并不是必然的，而是偶然的，非.从属的，某一 
项误差并不必然引起另一项误差。由于在原始材料中存在着偶然 
酎误差，对这些村料的实际估价便会时而过分夸大，时而过分贬 
低。所以，原始材料中的误差不可能在归纳过程中积累起来 p 但 
这些误差也不可能完全相抵。因为第一，一项误差有可能附着在 
另一项误連上；第二，各类误差不可能是相等的。原始衬料中的- 

^① O .摩 拫靳特 :《论经济铳 计考察的准 确性％ 莫斯科1963年 ，第 164、174、:; 
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误盖具有偶然性和非 从》性 ，这就使误差既不可能累积起来，也^ 
不可能完全相抵，而只能是逐渐 减少。 原因在于，一定数量的各 ■ 
不相关的事件共同出现的概率（从概率论的角度看，误差恰好是丧 
现为互不从属的各种偶然事件)等于这些事件_全部概率商乘_。® 
比如，如果由于不正确的计算而过分夸火材_ _単雙_手把 5 ， 
由于收集资料的人的利寄关系而过分夸大材料荊概率等于 L 5,. 
屮子传布材料的人的利害失系而过分夸大紂料的概率等于 0.5, 
那么，所杯误差的概率累积就 将是： 0.5 X 0.5 XO ,5=0.125。 现 
在，我们可举一个研究者在具体历史研究中整理和归纳统计衬料 
的事例，用以说明上述有关个别误差的普遍原理。 

在研究 〖 9世纪粮食价格史的过程中，我们犮现，为确定 
平均价格而对原始资料进行整理，结果往往会出现歪曲真正价格 
的倾向。乎均价格的最大误差——由一项误差加上另一项误盖而 
得出 一 等于下面7种误差的总和:1 .县内价格由于缺少全月 
价格的树料而与粮价的误差为 0—5 钧； 2 .省内价格由于缺少 
各县的价格材料而与粮价的误差是 5 — 8袼； 3 .由于对粮食质 
量估计不正确而与粮价的误差是5 —10势# 4 .由于对价格估计错 
误而与粮价的误差为 0 — 5 场；5.由于实物 （ 量或重量)欠准确而 
与粮价的误差为3 — 5 %; 6 ..由于未能完全准确地将批发价换算 
成零售价而与粮价的误差为 1— 4场； 7 .由于未能完全准确地将 
零售价换算成金卢布而与粮价的谋差为1 一 3 痴。由此，全部误整 
的总和就柯了一个很高的数额，即偏离真正粮价40嗨。但是, 
出现这种最大误整的概率却是很微小的。如果每一误避的概率不 
超过 0 . 5 ( 因为误差是偶然的，它有可能发生，也有可能不发生），那 
么，误差概率的累积就是 5 X 0. 5 X 0.5 X 0,5 X 0.5 X 0* 5 X 0*5 
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- = LQOS e 因此，在推算省内价格时，发生偏离真正价格 IS —4(3 赛的 
误差_可能性不会超过8备。而发盅偏离真正价格40势的误差 
的概率还会更小，因为，每项单独误差是最大的，其概率将小于 
Q -5 0 实际上，最大误差的可能性就被排除了。 

按照上述推理，那么，在对档案和期刊中始相■进^ 
归纳时所得出的一般平均价格，与真实价格的误 1 _差通常 _ 不会頬过 
10^& o 

由于原始材料不准确，况且，在对这些原始材料继续整理时也 
不会减少这种不准确性，所以，在历史研究工作的实践中，不能 
不认为那些由研究者支配的、常与实际偏差在20?&以内的统计材 
料是好的材料。 

这一结论不应使历史学家们丧失信心，因为，在自然科学中 
有关被研究对象的材料也并不绝对准确。比如在现代物理学中， 
那些拥有最新电子设备的学者们迸行的测量，其准确 . 性一般为 
J 0~50 资，而且，这还是在一切都能加以测量的情况下。从整体来 
说，在物理学的测量中，准确性达到10资就被认为是很好的测量 
了。 

显然，世纪以前各时代的历史统计整体上不够准确，因为当 
时统计资料收集和加工的手段远不够完赛。但是，这一结论只是 
泛泛而言才是正确的，因为在统计资料的 H 年舲”和准确性之间 
并不存在直接联系。许多资料取决于材料本身、收集材料的方 
法1甚至是对它们进行加工和保存的具体特性。如 15—17 世纪的 
税册(古罗斯人口地亩税的登记薄——译注)，在许多研究者看来， 
它包含的材料是如此准确，甚至超过了 19世纪许多官方统计楗料 
的准确性。 

历史学家对统计材料可靠性的要求往往过高，他们总是认 
为， 如果误差达到10_20铎，那就该放弃分析所发现的材料。但 
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这样 一来， 一般 就要放弃研究有关我_过去的大量统计资料。在 
苏联历史学家的研究实践中，还有另外一种倾向，这就是有相当 
多的人认为可以且需要利用所有的统计资料6但是^ _条正确 
的道路必须极其 谨慎， 同时采用各种可能^^包#¥数_统 
计的 方法，来估价历史学家所要运用的材却靡 
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第二章怎样小中见: 

(历史科学中的抽样法） 


^ 0 ^ 


象世界一样古老的方法 


研究不太久远的过去或现代社会的研究者们经常能发规，存 
狴资料足他们完仝无法加工整理的。因此，这些研究者常常因为 
不知道选择什么样的资料更好而陷入窘境而那些研究久远过去 
的历史学家则更为经常地感到缺乏必要的材料^而且，历史学家 
所研究的年代愈是久远，他就会感到资料愈是短缺。结果，这类 
历史学家常常不得不根据仪存不多的史料再现各类事件的进程， 
或是根据偶然保存下来的材料描述某种复杂酌社会经济现象，历 
史学家扮演的这一角色，颇有些象残破艺术品的修复匠，他们象 
后若一样常灶于彷徨不决的痛苦之中。 

由此，历史学家们便会经常面临以下两种选择；要么根据仅 
存不多的材料获得广泛而确实可信的历史画面，要么从大蒉资料 
中选出起码数遗的枋料，以此作为全面估价所有现象的裉据。如 
果借助于数理统计中经过良好锤炼的抽样法，历史学家将能够使 
这两个问题得到完好解决。 

抽样法即在对大量同类客观现象进行研宂时，以茼部研究代 
替全面研究，同时保证在结论中不出现重大错误——这种思 SL 
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"大 娜 就象人类自身一样古老，或许在人类之; ts 便已存在了。因 
为，从一系列低等动物的习惯来说，它们总是预先尝尝堤供给它们 
的部#食物，然后根据仅仅品尝到的邱分食犓而舍弃其余的 ”1® 
在古壤及和击希腊，抽样法思想曾被用来研而在 
17— 18世纪的俄国，为确定全部收获量的多\^而:#验测收获 i 和 
净粮 is 方面也运用过这一方法。② 

历史学家对抽样法思想并不陌生。当他们不得不利用极少置 
从过去保存下來的资料，或相反，当他们仅限于对大量材料进行 
局部研 邦 时，实际上他们就是在利用抽样法，尽管不是在严格的 
弊学基 础上。甚至畲些历史学家常常把局部研究称做抽样研究 

' 抽样”研究法的称谓很好地揭示了这一方法的涵义，亦即 
从人姑的资料倍息中进行选但是，由于历史学家在各种局部 
研究中广泛运用“拙祥”这一术语，从而使之认为 t 抽样法并非专 
门的、特殊的方法，它不是数理统计的 方法， 而是历史学家在研究 
大 m 史料时所运用的一般的、广为流行的方法。这一不正确的 m 
念很有可能要影响抽样&的正确运用，影响在所苻范围内按照所 
有要求和条件运用抽样法。 

巧合虽不可靠，但却慷慨 

为使局部调查被认为是抽样研究法在数学统计意义上的运 
用，必须遵守一个条件，即局部调查的对象应该是随机选出的， 
或抽签或凭机遇。无论多么离奇，抽样法就是要利用那驻常常是不 


⑦ Z 1 • y * 莱赫曼 ： 《统 计应用》，炱斯科1969年，第201页 0 

⑧ ■ 年利耶夫：《抽样研宄的产生及其在俄国的第一次尝试》，载《统计学 
报》, 1927年第 1— 4期。 
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W 搌的 '意外巧合”。利用“意外巧合"将使我们得到很多 系两 。 I 
那么，“意外巧合”是怎样帮助研究苕的呢？ ^ 

把拙样调查的结杲鲁遍用千所布被研究的对象，或是裉据部 
分估价一个整体时，研究者不可避免地要犯某种屬误+即象敎專： 
家所说的 代表性错误。 但是，在这一错误表 现为偶 错^ ■说 i 
差的条件下，人们可以预见这一可能的错误的+小_。_15>有当被 
研究对象是随机选取的时候，才有可能出现偶然的抽样错误，对 
偶然的抽样错误进行预见一 i 要是在分析选取的材料时—— 是 
以概率 论为基 础的。 因此 ，总的来说，抽样法的根据就是 概率论。 

抽样的随机性 是指： 在抽样过程中没有任何成见，并遵循使息 
体①中每一因素有均等可能性成为样本的原则。要使样本成为真 
正随机的，只有以这种方式从总体中抽样 i 总体中的每一因素都 
有均等 机会被 柚取，除巧合外，其他任何因素都不能影响某一因 
素是否中选。因此，随机性更多的是直接与抽样过程和油样改 
计，而不是与样本本身相关。只有当总体中每一单位都有均等机 
会被抽取时，样本才是随机的。为保证这种机会均等所采取的顸防 
措施应有尽有，只是偶然性除外。因为，研究者总是特别小心， 
以保证+让任何一种偶然性破坏抽样的随机性 a 

如果历史学家是从含有众多材料的总体中抽取数据，那么， 

可以借助于抽签和随机数字表来保证抽样的随机性。比如 ，抽 
签， 就是从认真均匀混合好的一付睥中抽取齣奸号码的卡片。利 
用 M 机数宇表一 它们有可能同时存在几个，而且是以不同的方 
法构成的一汕样，则是要选出那呰顺序号码与数宇表中列出的 
数目相吻合的数目。 

下面我们从一个含有10400个四位数的数表中举出 2 0个数 i 


①总体是指那些可以从中选出某些部分以供研究的客体 
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如梁人们决定要从假定由 7 QOO 个单位构成 的总体市选出 10 个 


单位，那么在把这 70 CK 3 个单位编号后，研究者就可根据数表选出 
10个不超过7000的数。结果，胺照顺序号码被选中的单位如下（按 
数表中的先后排列）： 3992, 1545, 3408, 1 H 2, 1405, 1396, 


2762, 6107, 3563, 6008。 

当运用抽签或随机数褒抽样，亦即运 用简单 随机抽 样不能 
达到目的时，人们还常利用其他抽样方法，诸如机械抽样法（又 
称系统抽样法)、典型抽样法 （ 又称分层抽样法）以及聚点抽样法 
(又称整群抽祥法）。 

机械抽样， 就是把总体分解成许多相等的部分，并从每一部 
分中抽取一个单位。实际上，这一办法是通过抽选带有一定顺序 
号码的单位实现的。比如，人们可以抽选第一、十一、二十一等 
等单位，当然 * 也可以抽选裉据抽样间距而定的其他号码。 

典型抽样法或分展抽样法 是指，按照某种特征把总体分成若 
千典型的组，然后从中或随机或机械地抽选若千单位。比如，作 
为研究对象的领土，可以分成社会经济条件和地理条件各不相同 
的若干地区，之后再从每个地区中抽选一些单位做样本。在这样做 
时，可以与每一典型组的数目成比例地抽选，也可以不按比例抽 
选。 但按比例抽选更好一点，因为它能使结果更准确。 

在进行 聚点抽 样时，随机或机械抽选出的不是总体中的各个 
单位，而是其中可以进行充分调査的若干组或群。比如，被调查 
的不是单个的农民经济，而是整个村庄或庄园。 
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在计 i 时运用哪种拙样方法，这取决于被研究对象的厲性， 
因此必须预先了解研究对象。 

当抽样对历史学家来说是 自然形 成的，換句话说，当历史学 
家把从远古保存下来的#料看成是准备好的抽样时,程# 
大为复杂了。在这种情况下，要求研究者证样是 
随机抽样。因为， 并非毎个 自然形成的抽样都是 随机的 历 
史孕家得到的材料，在其收集和保存过程中具有人为性并 有很多 
偏颇，那么随机原则就遭到了破坏，抽样也就不能具有代表性和 
带来十分可靠的结果。 

兑有我们能确切知造，取舍任意一部分材料均不与收集和保 
存树料的人的利益相冲突时，只有当我们的祖先在为保存而选择 
各类文件过程中不依历史学家调査的特征而确定选择范围时，我 
们才能确认，所保存下来的资料是随机抽样。我们说，如杲研究农 
K : 状况问题的 历史 学家发现了农户的记录，其中部分得以保存下 
来是因为宇迹牢尚，那么适于利用的部分记录就可视为随机抽 
样。如果保存下来的记录只是在丰收年或歉收年形成的，_么保 
存下来的枒料就不能被认为是随机描样，因为这些材料得以完整 
保存下来完全是取决于历史学家所研究的特征，即取决于农民的 
地位与收成的密切关系0 

抽样方法与价格革命 

现在，让我们来看几个利用抽样方法进行 M 史研究的具体实 
例 5 首先，我们必须确定一下各种统计量的重要术语：箅术平均 
敏、众数、中位数、方差（又称离中趋势——译注）和标准差。 

算术平均数 （s ) 是表现一类同质社会观染数量特征一般大 
小的概括指标，几个数值之和 （ 〜…… Jr n ) 被《除，所 
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得之商就是， 、： 

_ = ^ ' 

n 

众数是指总体或统计数列中发生次数最多的数值。 

中位数是指在一个按数值大小排成的数列中拉置居中的那个 
数。 

方差是变量序 列中指 标嫁动的标志，在 患体 ^记祚 a 2 ， 在 

游本中记作 W 。 方差乃是变量数列全部指标的数与这一数列的 

_术平均数之蔑的平方的平均值。用下列公式表示： 

… 2 _ S ( X -^ 

Sx = 一 n 

<方差的平方根称做标准差： 

在苏联历史编纂学中，抽样法已被用来分析18世纪俄国粮食 
价格的运动。研究价格的迫切性在于，如果不研究一般价格，特 
别是粮食价格的历史，国家经济生活史中许多有重大学术价值的 
问题，诸如居民生活水平的动态、国民收入、劳动生产率与国家预 
算、经济形势、政府贸易政策和其他一些问题，就不能在髙度和学 
的水平上得到 解决。 因为，如果不考虑桥格的变化，那么对不 KG 
间 和不闻国家的各种经济指标进行比较就将失去可寐性 a 比如， 
人们在文献中断定，18世纪下半期 对外贺 易周转额用货币计算 
增长了5倍①，而农民的贡賦和租税増长了2 — 3倍©。但是进行 
上述统计的研究者们并未考虑价格的增长。如果考虑到价格增长 
调素而修正这一结论，则实际的变动大不相同：对外贸易周转额 


① H.JT ■鲁宾 施坦： 《对外贸易和俄国商人》，载《历史札记》，1955年， 

第 S 4 卷，笫346页。 

^ 《苏联史钢*封建时期》诏世纪下半期的俄国》，莫斯科19 讣年 ，躬 54— 
55页。 
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只增氐〗倍，贡赋和租税 M 増长 0.3 倍。 

研究 1 S 世纪粮食价格的中心任务在于确定各个省、地区以及 
全俄国在18世纪每一年的平均价格，并揭示一个世紀内粮貪价格 
的浮动状况。但是，在研究了保存在苏联所有中央档案馆及 A 4 个州 
的档案馆中的史料之后，人们发现构成 i 8世纪俄国各城市系歹_ 
格表的枋料是不 足的。 比如，17 OS — 1717年间拥有黑麦价格_爾料的 
县的数目如下： 1 T 08 年有36个县，1709年有34个县，1710年有28个 
县，1711年有35个县，1712年有30个县，1713年有33个县, 17 M 
年有35个县，1715年有30个县， W 16 年有33个县 ， m 7年有31个县 * 

在18世纪的100年中，只有 1744—17 T 3 年和1 7 邪_1801年， 

即总共有36年保存了俄国大部分城市 的价格材料。但即便是在这 
些年内， 也 感觉到某些地区的材料有所不足。 

在收集并整理保存下来的有关粮食价格的材料之后，便出现 
了两条继续研究的途径：1.在不超出所收集到的价格材料所规定 
的范围的条件下，详细分析价格运动； 2 .尽管有疏漏，但还是可 
以揭示出全俄国价格运动的概貌。在前一种情况下，历史学家为 
枋料本身而分析收集到的衬料；而在第二种情况下，收集到的材 
料则是作为能反映整个“价格 世界” 的一面小镜子。不懂数学的 
研究者会走第一条道路，而懂得数学的研究者则倾向于走第二条 
道路。 既然读者已经懂得数学或者想了解数学，那么，我们就请 
他走第二条遺路。 

由于为获得 1 S 世纪谀国粮食价格运动的 一般概 貌所需的资料 
是不齐全的，因而必须运用抽样法，我们将把保存下来的特定一 
年内粮食价格资料的总和看成是样本。这样，我们就有了自然形 
成的样本。而总体不是别的，正是所有保存下采和未保存下来的 
有关该年粮食价格的资料。根据样本数据，我们就 能对总体进行 
判断了，换句话说，我们研究收集到的价格资料，不是为了这些 









资料或身，而是将其视为一个能带来结果的试 

够发规存关价格的新史料，那就将证实这一结靖一 

抽样结果的准确性取决于抽样的数量和被研究特征的波动幅 
度。参加抽样的价格材料愈多，俄国各城市价格的波动幅度，愈 
小，那么，根据保存下来的抽样材料而得到的俄国粮食价格运动 
的概貌就愈准确^虽然每种抽样都会带来偶然性错误，但这一错 
误的大小总是可 知的。 

由于有关18世纪俄国粮食价格抽样材料的数目已由保存下来 
的价格资料的数置所规定或给定，因而价格波动幅度将是决定妯 
样准确性的屯要因素价格的波动幅度可以依椐以往的研究而预 
知，也可从抽样材料中获得 & 就象任何抽样一样，我们的抽样应 
符合两个要求，即具有代表性和随机性 。代表 性要求抽样足以代表 
总体的特征；而随机性则要求样本必须由各个偶然中选的单位构 
成。 w 个要求并不矛盾，因为代表性是由抽样的随机性予以最终 
保证的。因此，在完成价格材料的收集后，运用抽样法进行研究 
的历史学家还必须要检验一下13然形成的样本是不是随 机的。 

如果了解1 S 世纪价格资料收集和保存的程序，就可以有信心 
地说，在价格资料收集和保存过程中没有任何人为性6几乎每一年 
的价格资料都是由省投或总督办公室里送给中央机关，在实际利 
用期限过后，这些资料通常就被存档 & 然而，并非所有在18世会己 
收集到的价格资料都能传到现代历史学家手中，原因不外是在 
19~20址纪期间，许多卷宗或是整个档案遭毁。但显而易见，档 
案材料被毁并不是按照一定;的计划进行的，而是 S 然的 & 因此， 
保存下来的材料就是随机抽样， 

为了最终确认保存下来的18世纪粮食价格的材料是随机的， 
我们可以利用一种检验随机性的专门方法，比如符号判据法 & 为此 
把某一年内以戈比计算的每个县的粮食价格材料按其在史料中发 
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观的先后 m 序列成一个序列。然后,再用每一个甚蟫粮 去」 
前一个‘的价 格， 相应的差或正 （ + ) 或负 （一 ）^_杲，我们就 
会获得一定数量的正号和负号 p 如果具体价格之间的差是随机 
的,也就是抽样是随机的，则正号与负号的数目应大抵相等，因为 
在所有 k 存的材料为偶然的条件下，备县的价格之间正负差的重 
复次数应是相等的。比如，在 U 08 年，对各县的价格进行计算之 
后4正芎数为15，负号数为16。因此可以断定抽样是随机的，因 
为我们从一个专门的表中得知，力确定在3 &个单位中柚样是随机 
性的，必须是正号数在〗 2 到 2 4之间波动 （ 见表3 乂 


表3 用“符号判据法 u 检验1703年抽样的随机件 


县 

价格 

(戈比） 

差数 

符号 

县 

价格 

(戈比) 

差数 

符号 

1 ! 

i 县 ！ 

1 

i 

价格 

(戈比>| 

差数 

符号 

1 

40 ； 

13 

43 


;烈 

36 

1 

1 一 

2 

43 j .+ 

14 

35 

一 

' 26 

50 

. + 

3 

40 

— 

15 

40 

. + 

2 ■: 

30 


4 

80 

~h 

1 G 

^0 


28 

24 

•— 

5 

74 


17 

3 G 

+ 

: 29 

25 

-I- 

■ 

6 

40 ；— 

18 

50 


: 30 

40 

+ 

7 

55 


19 

30 

—— 

! 3L - 

32 

一 

8 

42 

_ 

20 

20 

一 

\ Z：i 

30 

一 

9 

42 


21 

45 

+ 

33 

20 

— 

10 

50 ' + 

22 

40 

— 

M 

30 

+ 

11 

40 i — 

23 

42 

+ ■ 

35 

25 


12 

43 

+ 

24 

40 

—— 

36 

: 

32 

+ 


对保存下来的18世纪中 K 他年份的价格资料的随机性进行检 
验,结果证明在1708年的材料基础上得出的结论是正确的。 

总之，所保存下來的有关1 8 世纪各年粮食价格的材料都是随 
机的，而专门的检验则表明，它们是从属于正态分布的。接下来 
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我们只需再确定一下具体 的抽样 S 式， 以便更_当減解4我命 
所提出的任务，即获取仝煆国和个别地区的平 1 也价格 

如您所知，有三种抽样方法。考虑到我们不仅要知道全俄国的 
平均价格，而互.想知遒地区的平均价格，甚至对在俄国领土上能 
划分出一系列地区一在这些地区中 备个县 的价格某种程度上是 
相同的——也感兴趣，因此，适宜运用分层即典型抽样法。按照这 
—抽样方法，历史学家找出的价格树料是按俄国的各个地区分布 
的。 这钱问时抽取出的材料在根据地区数目构成一些小样本的同 
时，也构成了一个大祥本。适于运用分层抽样法的原因恰恰在 
于，这一方法出现偶然错误的机会少子-非分层抽样法。 

根据粮食价格分层，最好是依据绝大多数县在任意一段时间 
或中常收获年的材料进行。在 1744—1 T 53 年间和 18 CU 年间 
就有这类价格材料。对各个县，省迸行分组所依据的是18 此纪末 
的行政划分，这次行政划分之后，俄国被分成了〖0个地 E 。 

在分层之后，我们就可以着手根据抽样材料来确定10个地区 
中每一地区的粮食平均价格，并据此确定每一年全俄的平均价 
格。 

最后，在研究工作的最后阶段，必须搞清楚根据抽抨材料算出 
的粮食平均价格在多大程度上能与历史学家根据每一年的粮价 
材料所能得出的、真实的平均价格相一致。换句话说，必须确定 
可能出 现的抽样错误（一般苯说，错误可能出现也可能不出现） 
以及真正的平均价格必然位于其中的置信区间:。 

抽样错误 （ ¥ ) 可以用下面这一简单公式求出 t 


其中#是柚样的平均误差， h 是样本的标准差,《是样本的数 H 。 
对于一个观察在30次以上的抽样来说，置信 g 间可以按这一 
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基本公式确定 s ^ 1 *98 fit , 

在做了相应的计算之后便可断定 t 在欧俄，黑貧的 
真正平均价格是围绕40戈比这一抽样平均价格上下波动 S 戈比， 


因而是在 37 H 3 戈比之间。这一结论的置信度为95够，就是说， 
如果在1708年内又在36个县中的每一个县做100次其他抽样，那 
么只会有5个新的样本其真正平均数值会超出上述范围。人们可以 
用类似的方法算出1708年10个地区的平均价格和置信区间，算出 
18世纪其他各年内全俄及各地区平均价格和置倍区间。 

综上所述，由于运用了抽样法，我们便得以确定俄罗斯10个 
地区的平均价格以及18世纪内每一年全俄的平均价格，并在此基 
础上揭示一个世纪中俄国的价格运动。真正情况是 t 在1&世纪粮 
食价格增长了 4.7 倍。这意味着俄国在18世纪发生了价格革命， 


它比西欧晚了 150年，但对俄国社会经济和政治生活的各方面产 
生了重大影响。在18设纪，特别是在价格革命的影晌下，俄国的 
商品货币关系迅速发展。地主经济从自然经济转为从事出口的商 
品经济，劳役租制得到扩大和加强，耕地面积有了增长。价格革 
命在俄国产生的另一个重要后杲是出现了国家预算的经常性赤 
字，形成了国偾，由此而发生了对农民创造的剩余产品进行有利 
于地主的再分配。这一苒分配的原因根源于国家贡赋的增长落后 
于价格的增长和地租肘增校。正如我们看到时，借助抽样法分析18 


世纪俄国粮食价格的结果 证明： 研究和利用这一方法所付出的劳 
动和时间是完全值得的。 


19世纪上半期农民状况恶化了吗？ 

苏联历史学家 W * 科瓦利琴科在研究19世纪上半期农民 

经济状况时遇到了这样的任务，就是要将在分析自然保存下来的 
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抽样材料时得出的结论推及于所存被研究的现^ 象丄 ① 

历史学家很清楚，在俄国从封建主义向资¥ 至五过 渡时期 r 
农业史上一个最富争议的问 题是： 这一时期农民经济状况及农民 
地位在朝何种方向变化，变化的程度如何？部分研究#认为，在 
农奴制时代后期，基本农民群众的地位严重恶化了。另一些历史 
学家则认为，农民的地位并未严重恶化，因为地主的切身利益要 
求使农民经济保持在一定的中等水平#,当然这是为了自私的目 
的。 由于 这两种结沦所依据的材料，要么是与个别地主的看法有 
关，耍么就是基于并不特别准确的一般的官方统计数据，因此， 
上述两种结论均受到了第三类历史学家的怀疑。 

由于缺少大量并且淮确的关于世纪上半期地主农民经济状 
况的衬料，以致很难对农民的经济状况做出判断。这类材料一般 
保存在农民经济的户籍登记簿中，这种登记簿是在农民代表的参 
与下，由地主或其管家编写的。在这种登记簿屮记载着每个农户拥 
有土地、劳力、牲畜、粮食等方面的情况，这使历史学家可以考 
察农民的地位及其经济状况。但是， I 9 世纪上半期保存下来的农 
P 登记簿的数量与地主地产的总数相比是不多的。曾经发现了 
3000份登记簿，包括由5万个地主庄园组成的 2 00份地产的情况。 
然而，重复登记一对同一个庄园进行两次或两次以上的记 
载一的材料只涉及40个地产，而且在年代上也总共只包括25— 
30年 & 因此就产生了一种 选择： 或是根据所保存的材料得出一些 
有奂农民经济水乎动态的概括性结论，或是只限于叙述个別地主 
地产中的农民状况。 

H H * 科瓦利琴科选择了第一条道路,利用抽样方法进行研 


① h * a . 科瓦利琴科：《对19毋纪俄国农民经济抽祥材料进行数学统计整理时 
尝试》，载 C 荚斯科太学学报 ： K 19砧年第期。 


41 







究。首先，他证明了自然保存下米的材料可以认为样， 
因此，这®材料可以成为揭示农民状况及其经济状齟的薄 f ® 性指 
标的基础,然后，他根据所保存的200份户籍登记簿的材料，确定了 
农民经济的重要指标 i 1800— 1830年和1831 —1860年间，在黑土 
地带 （ 中央黑土地区和伏尔加河沿岸）和非黑土地带 （ 工业中心 
和西北俄罗斯 >两个地区中每一地区拥有的土地、牲畜等。在这 
之后，作茜又计箅出一个置信区间，亦即判别中央俄罗斯地主农 
民经济状况，.农民处境及农民分化性质的不同指标的上下限。结 
果表明，1831—1860年与1800 — 1 S 30 年相比，农民总共拥冇的牲 
畜在黑土池带下降了 3 — S 够，而在北黑土地带下降了 10—12 热。而 
劳动力、播种面积、收成也出现了类似情况。这样，由于运明了 
抽样法而最终查明，在19世纪上半期，俄罗斯地主经济及农 K 经 
济水平具有下降趋势， 而农民的处境 则是趋 于恶化 & 

根据所保存下来的抽样材料来确定农民经济状况的概括忏指 
标，这亦有助于解决其他重要问题。如果发现19世纪上半期农民 
中贫困阶层、中间 阶层和 富裕阶层的数量比例发生了变化，中农 
减少而贫困农民增加，这就证明了时发生了农民社会分化的过 
程。 

最后，在 M ■ U +科瓦利琴科的研究中还表明，他在分析户籍 
登记簿这类可靠史料的基础上揭示出的农良经济发展璋势，与宫 
方统计，首先是与省长报告所描述的概貌相吻合。这种吻合使我 
们有理由 认为: 全部官方统计勾画出的19世纪上半期农村经济发 
屐的概貌是可信的。确认官方统计资料可信，这具有重要的科学 
意义，因为关于农奴制时代俄国社会经济发展的大部分材料均保 
存在这类统计中。 

如上所述，远用抽样方法使我们可以揭示出农民各社会集闭 
拥有 土地、 劳力、牲畜以及备个地区农民分化的性质和进程的_ 
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籲镢 貌，并芪此基础上洋细分析农 H 中封連生产关系解体及资本 
主义关系发展的过程，这比在历史研究中对历史统计材料进行一 
般的、传统的分析要更深刻、更全而。 

以上考察的实例令人信服地证明，运用拙样方法分析自然保 
存下来的历史统计材料是非常可 能的： 第、它可以使历史学$ 
根据抽样材料分析被研究的现象和过程，从而 
结; 第二，运用这一方法可以避免出现 缺少根 <^论> 游#^ 
它使得在可比材料缺少或不足的情况下，有可能研究各类现象 
的 动态， 关于运用抽样方法进行研究的第三个方面具苻重要意 
义，下面较为详细地进行论述。 

在运用 传统的 分析方法揭乐历史进步进程时，必须具有关于 
某一研究对象 的不同时期的材料。而所保存下来的可比材料通常 
大大少于每一时期存在的整体枋料，这就使历史学家不得不缩小 
丫自 Q 的史料学基地，冋时 只能 报据可 tt 林料而不适整体材料得 
出关于事件进程的结论。利用抽样方法则使历史学家-有可能通过 
统计所有保存下来的资料研究事物的进程，由此所得出的结论不 
仅； fi 综合性的，而11更加可靠。比如，在分析18世纪价格动态盼 
事例中，任何一个城市、一个省都没有百年内每一年价格的充足史 
料，而在分析19世纪上半期农民状况变化的事例中，也只有20个可 
以对比的地在前一种情况下，如果按照传统方法分析统计材 
料，则不可¥得出粮食价格运动的一般 概貌； 而在第二种情况下， 
得出有关夢件进程的结论所依据的只是受历史学家支配的109&的 
资料，也就是 2 00个地产中时 2 0个地产的材料，垃显然是不够的。 

如已经指出的，除了利用可以称为“自然”抽样的那些部分保 
存下来的资料外，历史学家还可以根椐 他们自己从众 多的、往往 
是大鼍保存下来的完繫材料中抽取的样本，对被研究对象做出一 
个可靠的一般判断。借助于专门在数理统计中运用的抽样手段， 
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历史学家就有可能获 得所谲 要的准确可靠的嬌杲。在这种情况下， 

他们 R 须确定样本的必要数量，因为结论的可靠性取决于该数 

似是应时刻记住，如果抽样不正确，如果在获取样本时没存遵 
守抽样随机原则，那么即便有大量的样本也木能带来正确的笔果 
也就是说不会反映总体中各事物的真实状况，这方显的 j 
例子是 1 &36 年一家美国杂志根据 200 万荧国人对杂志!胤查表-的 
复错误 预测： 在总统选举中共和党会取胜。拥有大量的选样，在 
前四次美国总统觉选活动中成功地运用了抽样调查，这些本可以 
保证抽样能正确预测1936年的竞选进程。上面提到的那些答复表 
明民主党人富兰克林 ■ 罗斯福将遭到失败。但事实上他被选为总 
统，而且是获得了大多数选票，这是芙国历史上获选总统得到选 
票最多的一次 。预 测失畋的原因很大程度上在 于：样 本对全体美国 
选民而言不具有代表性，因为抽样不是随机的。杂志的调查表是 
寄给这家杂志的读者以及电话拥布者的，在电话査询簿上可以找 
到后者的地址。而这家杂志的读者棊本上是站在共和党人一边， 
加之共和党中拥有电话的人比民主党多。所以样本只反映这类人 
的 意见： 要么是该杂志的读者，要么是电话拥有者，也就是对共 
和党 人有好 感的人 。① 

爱沙尼亚历史学家 K ) • 卡赫克成功地避免了美国杂志编 
辑部1936年所犯的错误。②苏联的研究者以高度的职业水乎进行 
抽样调査并因此而获得了重大研究成绩。卡赫克的任务是 
根椐纳税名册的材料揭示19世纪上半期爱沙尼亚农民分化的进 


① * 莱赫受 i 《统计应用》，第222页《 

② K> • K). 卡赫 克： 《运用统计抽样方法分析19世纪上半期纳 税名册 》，载 
《狡罗的海沿岸民族史的史料问 题》， 里加1970年。 
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裎。完成这一任务须分儿个阶段。首先，为获得关于当时爱抄尼 
亚四地区中每一地区的可帒结论，必须确定要调丧多 少地上 地产。 
为算出所需领地的数量，我们可以列出下面这一不太复杂的公 


式 t 


_t 2 $ 2 N 


在公式中， n 代表为获得有关被研究现象动态的对靠结论-而诘 _ 要 
研究的最少地产数； h 代表样本出现可能的错误的临界点； S 代表 
捽准差； i 代表在诙抽样的 基础上 做出结论的可靠裎度或概率（当 
时，结讼的可靠性为95钧，也就是说，如果再做100次同样 
的抽样，其中最多有5次新的抽样不能出现第一个样本的结果）。 

计算结果表明，为获得 可靠的 结果需要调查 U 57 个地主地产 
中的39个，即约占总数的4碼。 

在工作的下一阶段，卡赫克技照年限为每一地区又确定/二 


个样本，即 U 16、 1834和1850年。在对地产进行抽样时，可以借 
助于前而提到的随机数字表。开始，卡赫克抽取了42个地产，随 
后为检验所获得的结果叉抽取了47个地产，最后，他把所 柯地产 
联合成一个大样本，据此得出了可靠的概括性结论。 

结果表明，在19世纪上半期，爱沙尼亚破产的、不能独立经营 
且不能服劳役的农户从 W 1 S 年的10势増长到 U 50 年的17%。由此 
可见，在爱沙尼亚农村，破产农户的数 M 増加了，但增 K 过程缓慢 
并且是渐进的。农户的破产并非在封建制度最耵的危机时期突然 
出现的，此前早就发生了，因为还在 1 S 16 年这类农户的比重就巳达 
到了 U 获取的材料还证明，我们没有理由夸大农民分化的意义 
和规模，亦即没有理由说大部分农民经济遭到了经济破产。 

K ) K )- 卡赫克得出的结论具有重要科学意义，因为它对爱 
沙尼亚农民史上的争论问题做了解释，并迫使人们重新考虑在这 


4 
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一问题上存在的两种观 点， 根祕其中的一种观点，在19世纪上半 
期 的爱沙 尼亚，农民的分化过程极其强烈；相反，根据另一种观 


点，独立农户的比重有所扩大。 

从保存 下来的 众多历史统计材料中成功地获取样本的另一个 
例子是 K)_ ji 贝斯梅尔特内的研究1作，他婼研究12 — 

扣北部贵族发展的史学家。 ® 作者发现了 
记泌，如见对这呰记录进行完整的调查需要极大的^ _ 万， _ 因此他 
运用了袖样法。 fo * J 1 - 贝斯梅尔特内苜先确定了为获得可靠结 
论所需的数据份数，然后他通过机械抽样法抽取了全部领地的 
10 吸或 so 热构成样本。再后，他根据样本确定出他所需要的指 
标：±1建上地产的构成、封建领屯中各财产集团的比例及其他一 
些指标。从这些指标的 S 信 KN 中可以估计所获得的结果的可靠 
程度，其可靠程度是很高的。这样，作者便成功地揭活出了贵族 
的经济结构及其社会同类性的程度，但为此付出的射间却比完整 
地分析保存下来的资料所要付出的时间少5 —10倍。 

综上所述，运用抽样方法对过去保存下来的 xM 历史统计紂 
料进行分析可以大大节省时间、精力和物力，并可使历史学家获 
得可靠的结论，存时，这些结论在其淮确性方面并不亚于利用整 
体调赉所获得的结论， ' 


大数定律 

为什么样本能够保证结果能象整体调查所获得的那样可靠 
呢？这是因为与所有资料相比并不太多的一部分资料一■如果它 


①10 ■ J 1 * 贝斯梅尔 特内： 《12—： U 世纪 初法画 北部贵族历史的几个问赳 》 y 
栽《法国年签 （ 1966年 .） 》,莫斯科1967年， 
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们适借助于随机油样得 到的' —可以揭示出被研究观象所从属的 
一般规律性。这 M 起作用的正是所谓的大数定律，它是柚样法的基 

TCllt 

下面的例子可以形象说明大数定律的作用。在进行-次社 
会调查时，首先向 5 00人提出了一定的问题。对 这二卸 题-做杏译 
答复的人占被询问人的 54 . 9 的；然后，再向 I 0 dp 3 出 
题，社会学家所得到的否定答复占被询问人的 5_ L 9 对 
S 000 人提问，结果与前差不多， 为55•峰 t 最后，$向3万人提 
问时，否定答复占所有被洵问人的 55 . S 势。由此可见，为了知道 
在这一问题上持否定答复的人约占全部被询问人的 54—50 邻这 
…结果，弁不需要向所有的人或是 3 万人提问，而调查500 
人即可①应该注意，大数定律只在大规模过程中起作用，在这种 
过程中每个平独柚取出的因素都是随机 数值。 这不仅是一般规律 
作用的结果，甚至也是大量不依赖于这一规律的因素影响的结 
杲。由此看来，基于大数定律的选样法不能用来研究个別对象、 
个别的有杌现象，而只能 在大量 观察事实的前提下，利用抽样法 
研究 大规模 过程。 


<D 10 ‘ fo ‘ 卡赫克：《运用统计抽样方法分析齿纪本半期纳 税名册》，親 
《波罗的海沿岸民族史的史料问题》，第332页 。 y 
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第三章历史学家能够预测吗? 

(对历史现象的回归分析） 


如果这样， 可 能怎样 . 

所谓预测％就是推断将來可能发生的事情。但对千研究 
1812年历史的当代历史学家来说，如果他将自己视为 1 SI 2 年事 
件的“同时代人”，那么1315、1825、1975年都是将来。因此，预 
测就有两种可能：逾越历史往事的界限进行预测，或在历史往事 
的范围内进行预测。以下就是在此意义上探讨科学预测的可能 
性。 

为了预测将来可能发生的事情必须了解过去，这是显而 M 见 
fttfo 那个认为将来仅仅是由现在产生的时代正渐渐过去^现在许 
多学者认为，长时间的发展趋势"积累”成为将来，而只有研究 
大的时间区段才能理解这些发展趋势。对过去经验的新态度在很 
大程度上解释了社会学家从事历史的兴趣，他们希望借助历史更 
深刻地了解社会发展的规律性，并以此为 基础预澜未来。 

在历史学中，科学预测包括三个方面：笫一，展望未来> 第 
二， 历史学家有可能不逾越历史往事的界限进行预测，甚至预测 
或推断那些已经发生但未保留下信息的事物，或确切地说，是复脈 
郞些 a 经消逝了的事实和丧失了的 文献。 
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〜： 还有第三点，它对于历史学中的科学预测十分重要，因此我 
们要详细地谈一谈。关于历史是科学还暴艺术的争论不能认为已 
经结束了。现在 > 大部分西方历史学家还继续相信历史是美丽的克 
丽亚，是九个缪斯之一。赞同这种观点的人从根本上否定了在历史 
学中进行预 M 的可能性^这是完全合乎逻辑的，因为他们认为 
就是艺术，而假如历史中的一切都象是小说或 tf 那样\ 
是特殊的、不可重演的，那么历史学中的预测臆是•梦^ 
幻。 

令人惊舁的是，那些认为历史是科学的历史学家也十分怀疑 
历史学中科学预测的可能性。他们的根据是，生活如此复杂，偶 
然性的作用如此之大，因此任何历史预测和推断象在咖啡渣扭.占 
卜-样毫无意义。“如果这样，可能怎样……——这已成为-句讽 
刺话，往往以此教训那些敢下进行预测和椎断的或者象通常所说 
的去臆想事件可能进程的历丈学家。 

于是，不赞同预测的历史学家们用直接的历史经验和被保留 
r 米、并且算得上准确的历史资料筑起了一道樊篱，人们无论怎样 
呼吁，所得到的也只是不理解和失望。这并不奇怪，因为一切否认 
有科学预测可能性的历史学家，包括视历史为艺术和视历史为科 
$的历史学家，实际上都经常进行蓣测，用他们的话讲即在“臆 
想％他们的做法比之“预测派”面史学家来更有“罪％究其“ 有罪〃 

的原因，恰恰是这两派都力图_价由他们揭示或分析的现象的意 
义。臂如，研究 k 族市场的人必得讲民族市场对国家经济和文化发 
展、对多民族俄罗斯国家形成的影响；研究 1卽1 年改革的人总是 
注意到改革对锒国资本主义发展的作用 f 而研究十月革命的人则 
经常强调其巨大的国际意义1对被压迫人民解放运动的影响等 
等。这样，’无论历史学家有意无意，在对历史上的任何事实和 
现余 的影响与意义进行任何一种评价的 时候， :他#舞 A 诸如 









“如果 1861 年没存废除农奴制' "如果 18 世纪 50 — 印年代民族粮 
食市场没有形成”.等等，即“如果这样，可能怎样……”这种激 
在的假设和推断出发的。因为，如果民族市场促进了生产力的发 
M * 那么没有民族市场，生产力的发展就会比较缓慢 I 班_废除 
农奴制导致资本主义迅速发展，那么没有这次改革 r 俄国^济则 
另当别论。简言之，任何评价本身都带有在、 
但却可能存在的情况的假设。 — 

因此， 所有历史学家都在进行® 测。只是一些人是隐蔽的， 
而另一些人是公开的。 

由于认清了评价历史事件的这一特点，历史学中数学派的一 
些代表人物把已经发生的事件同可能发生的事件悄悄地 作了出 
较，并试图使这种比较成为研究 T . 作公开的、必然的组成部分。 
这祌现象在观代戈国的计量丈学中 （ 在历史编纂学中对数学派这 
样称呼）①特别明显<> 例如 ， r • 福格尔教授通过查明他所能找 
到的资金社会锗蓄状况的材料，估计了 19世纪下半叶铁路在美同 
经济发展中的意义。②为此 s 的， r ，福格尔试 m 依据资本主义 
的经济规徉，查明在假设没荀铁路的情况下 1890 年美国货载运输 
能力的模型在将这个推测的货载运输模型同实际存在的运输模 


① 该词俄文为 KmoMSTpuka , 来氕英文 Cliometrics , K 4 UO 来自 cHo , 卽克叫 
亚，古希腊神话中的历史女神； MSTpuka 来自 metrics , 指应用计盘方法与数 
学分析的方法研究某一学科。两词的结合意为"计置史学 w 0 ff cliometrUs - 
—词最早出现在 SO 年代末的荚国史学界。泛指运用数理统计方法从事历史研 
宄的所谓"新社亡史 P 〃新跤洽史"及"新经济史"等——.译注 D 

② R-W - 福格尔： 《 铁路与美囯经济发展:关于经济史的洽文》，巴尔的摩、 
马里兰1964年。 

® 在这里 R * 福格尔运用了西方史学家婭常利用的反实阮仿造模型的研究方法。 
即根捉实际存在的某一历史事伴，按该事物不存在的态势建立模型。然后将 
由此得到的数据同历史实际进行比较，判定该事物是否起到传统史学方法确:. 
定的那 种作用 译注， 
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型进行比较之后, R •福格尔从数 M 上估计了铁路在美国经济发展 
中的贡献。他的计算表明，由于铁路发挥效用，1890年美国节约的 
社会价值不到总社会产品价值的5钧。据此, R ■福格 尔认为，虽然 
铁路在美国经济发展中有重要的作用，但铁路建设未必称得上是 
国家经济生活中的革命。这种结论否定了商代人和^ 寒国 多数 
历史学家推论的铁路在美国经济起飞中!^#决_隹炸用的观点。 

应该如何评价美国计量史学家类似 h 研究 ^法呢？ 

显而易见，对于从数量形式上评价这种或那种历史现象的意 
义的方法，只能持赞同态度。利用诸如4如果事件没有发生，将 
会怎样这种假设来评价历史事实的意义，也是公正的。尽管推 
断事情将会怎样，总会令人疑窦丛生，尤其对于诸如铁路的建 
设、废除农奴制等等这类复杂的历史事件和现象，更是如此。可 
以在以下意义上同意该锨代表人物的 观点： 评价历 史现象的意义 
时，最糟糕的莫过于泛泛地或仅仅停留在直觉水平上进行评论。 

这样，历史学中的科学预测有三个重要方面1预见将来，更奸 
地了解过去，正确地评价已经发生的事许的意义。在历史 科学发 
展的现代水平上，在采用数学方法的条件下，可以在上述三个方面 
运用科学预测。但这仅是对具有严谨 数量表现形式 的历史现象而 
言。这是对在历史学中从事科学预测的研究者的活动范围的要 
限定。尽管如此，仍然留下 了足够广阔和塞饶的 天地，以便充分 
运用由数学方法揭示的科学预测的各种可能性。回归分析在这些 
方法中具有重要的意义。 、 

回归 分析以及与此紧密相 联的相 关分析，在注意利用数宇方 
法进行研究工作的现代历史学家中，大概是使明 最普* 的方法0回 
归分析可建立前提与结果之间的数暈关系，由此， 从琢因预测结 
果便成 为可能的了。而且可以知道^随着原因的变化，结桌将会 
怎样变化。 
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从词源学的观点看，“回归^珂（嘴字面 赛义是 “向后洚 
动乃不能说特别恰当《而在数榮辞典里，，回归却占有必须使用它 
的重要地位 & 在本书第一章已提到的英国学者弗 • 高尔顿，为了 
表述他发现的父母与子女身高之间的依从关系，将“同涅” 一词 
从生物学引入到数学统计学中来。这种依从关系_是7返备”或 
回归，即子女的身高接近双亲的平均身髙 \例___ 父亲若 d 所有 
父亲平均身高偏离1 cm (或高或矮），则 jt 子的$高就会比所有 
儿子的 平均身高偏离1 cm 以下。由此断定，用弗*高尔顿的话 
说/‘回归是向平常人方向"或“向平均状态回归\ 

回归分析适用于对 或者有 因果联系或者有相关关系的历史规 
象 的研究，因为相关关系实际上可以视为因果联系的另一种形式 * 
当只有一种原因产生 和一种结果时，这种关系常常是簡单的 | 而势 
许多相互作用的原因产生一种结果，或者一种原因产生多种结果 
时，这种关系则是复杂的。在自然科学中，最常见的是具有简单 
因果 联系的事物，而在 社会科 学中，因果联系则大多是复杂的， 
因为仅 从表面上看，社会科学最基本的现象 就是复 杂的，多结构 
的，多原因的。 


酿酒业消耗了多少粮食? 


为了更奸地了解回归方法，我们首先考察在分析简单现象时 
如何运用这种方法。假设研究 W 世纪末俄国经济生活的历史学家 
研究酿酒业的情况，他们对于伏特加酒的生产与酿酒生产所需粮 
食数量之间有什么联系会感兴趣。为了回答这个问题，收集到被 
研 究变置 t 在统计学中，称任何被计量的、可取各种数值的特征 
为变量，“变量”即变化的量）的统计材料。这呰有关酿洒业及其 
所耗粮食的材料整理为表4。 
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*4 isas — 1836 年俄国用于酿酒的粮食消耗 


年 

! 18 S 9 

1890 

1892 

1893 1895 

1896 

濟精生产 j 

(TT 万维德罗）① 

1 

33 

31 

27 

2 % 30_ 

as 

粮食 总消耗 

(n 万普■特） 

I 

i 

j 46*2 

1 

43,4 

37*8' 


44, S 


表4表明，酿酒业粮食消耗与酒精生产数量有 臝线的 关系， 
即是说，随着酿酒量增加，粮食消耗也增加。 


两个变量之间的关系，在曲线图上更为清晰。 

经过曲线图上各点的直线表明，粮食消耗随着酿酒量的 
变化而变化。这种依从关系在数学上被称 为函数关系。 在我们的 
例子中，粮食消耗是酿酒此的遵数/函数”这一术语意味着，在 
两 个变* 之间存在着某 种常截 关系。 这个关系如何，由曲线和回 
归数学方程说明。酿酒业和粮食消耗状况以及其间的函数关系， 
可以由下列初等数学回归方程表示： X 表示酿酒量， 
y 表示酿酒消耗的粮食量， i _ 4 即是回归系数。 

在所研究的例子里，酿酒量是自变数，而酿酒的粮食消耗量 
是因变数。指出原因的变致，被称为自由的^原因的变数，或因 
数；而提出结渠、后果的变数被称作从属的，或结果的变数。 

在酿酒量和酿酒消耗的粮食 ti 之间，表现为完全函数关系： 
y { 以百万普特为单位的粮食量）以 I . 4 倍于以百万维徳罗为 
单位的酒精产量）的规模迅速 増长。 这;个简单的线性、矣系在图 1 
的直线上被绘出来。表示酿酒量和与其相适应的粮食消耗量的 
所有点，都&这条直线上，没有任何偏离；这意味着，酒楕产量 


①维 德罗为 俄茵液董名， 1 维德 罗等予12,3 升——译注 * 
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100 夯地决定着粮食消耗量。所以，若要确定和预测以后的粮食消 
粍量，只需丫解酿酒量和回归系数已经足够了 6 反之，若要确定或 
预测酿酒量，只需有酿酒所消耗的粮食树料并了解其回 a 系数也 
足够了。借助回归方程 y == i . 4 h 预测正在变成现¥_^$要把酿 
酒量 x 代入这个方程，很容易就能得到酿_耗爾^紙/而把 
消耗掉的粮食量 y 代入方程式，也很容易模。 

地主的收入取决于什么？ 

但是，一个原因完全决定结來的依从关系竭式极为少见。历 
史学家所遇到的绝大多数情况，变数不是函数关系。在社会科# 
研究的多数现象中，对一个因变量（结果或后果）发生作用的，除了 
主要的原因以外，还有众多原因和“一群”偶然性，它们导致冋 
一个主要的原因产生 出几个不同的 结果。伴随主要原因起作用的 
次要原因和各种偶然性的数量越多，结果之间的差异越大。变® 
之间类似的依从关系，被称作相 关关系 。人的知识量与年龄之间的 
关系就是这种依从关系的例如所周知，随着年龄的增校，学 
习与掌握的东西越来越多。但是，这种依赖关系是作为一种趋势 
而非严格的规律存在着。因为除去年龄以外，知识量还受到能 
力、教育、记忆力、健康状况以及其他因素的制约。所以，确定 
的知识量并没存严袼的相应确定的年龄6同样，如果试图建立 
“ 年龄” 与文化发展水平之间的依从关系，那么就会发现，其间 
的联系不是严格确定的。人类文化水平随着时代的发展 Tfil 提高， 
但制约这一提商限度的除去时代以外，还有生产力和虫产关系发 
展水乎、世界政治形势等等其他因素，即是说，“年龄”与文化 
发展水平之间的联系不是函数关系，而是相关关系。 

我们还是从心理学和历史哲学的峰巅，降落到产生―罪恶"的 
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土地上，来考察 19、20世纪之交俄闰地主经济的规模与其收入之阆 
相关关系这一具体的历史实例吧（参见表5 


表5 19世纪末赀族地产的规模与收入额 



因 变最： 总收入 
(千卢布） 


| 1.50 1.25 1 


I I i i i 

55 1.40 1.46 t. 60 1 .80 1.80 ： 1,85 


K 9[> 


从表 5 看到，地产收入额与地产规模同时增长。但是，存在于 
它们之间的依从关系没有提供根据地产规模值 （ 自变量） 箱确地 
预测收入值（因变 _S ) 的可能性，因为地产数的增长与收入额之 
间并没有严格一致的关系。 

了解贵族土地银 行相砹 的树料 （ 18 S 6 —191 5 年期间银行承担 
了 3 _ 3 万份以上地主地产的抵押) 沿发现 ，在一个县或一个省有数 
十个相同规模的地产收入不有的甚至有很大的差别产生收 
入差别的原 因是： 思管地产规模对于其收入额是决定的因素，但 
是土质、经背状况、地产占有者的经蓠能力、销售市场的远近、 
农艺水平、劳动力数 M 等等其他许多因素，也影响到地产收入。 

有两种方法，借助它们可以清除附加的、次要的、同时发生 
作 用的因素以及任何偶然性的 影嫡， 并且揭 示被轫 究变量之间的 
爻系,.也就是说，来 w 清冼”被研究变量的形象。 

第一种方法，编辑组合分组表（在表中对象或现 象根況 二个 
或三个标志分组，故名）。这种方法的实质在于，整理材料以 
从结果中消除不适宜因素的影响。例如如果把关 f 贵族地产的材 
料按照土质进行分组，然后比较虽然规模各异但土质相同的地 
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产的收入额，那么依此显示的地 产收入和规模之间的 关系, 就已 
经摆脱土质的影响了。如梁在每个同样土质的地产组中进 而挑沘 
同等农艺水平的地产子组，并且把这些地产模不同质和 
农艺水平相同的子组进行比较，那么土质的影响也可 
以排除掉。但是，其余的因素仍继续 起作用 r 者要确定贵族地 
产的规模与收入额之间的“纯粹”的依从关系，必 须具备这些条 
件： 借助分组成功地淸除掉地产规模以外的 一切因 索和偁然性的 
影响，即是说，将要进行比较的地产要具有同样的农艺水平、土 
质、役畜和劳动力、 地 产占有者有同样的经营素质 等等。 

上述消 除不适 宜因素影响的 方法不 仅极为 费力，而且研究者 
最终仍然不能挑出除规 模外所 有因素 都绝对相同的地产，因为做 
到这 一点实 际上并不可能 。因此 i , 研究者借助分组法将只能消除 
最重要的“障碍 w 。 

在解决关于消除不 适宜因萦对贵 族地产收入额的直接影响以 
及确定地产规槟与其收入额之间的关系问题时，第二种方法更为 
昝力， 也更有成效。这种方法就是礁定地产规模与收入额之间的平 
均比。 在这种情况下，允许个别地产偏离平均但是平均地、 
整体地看 ，这个关系对大多数地产是存在和有意义的。可见，这里 
所说的是，在除去地产规模以外的其他因素不起诈用的条件下，在 
与 迪产规模变化相联系的地产收入变化中显露出来的一种趋势。 

根据地产规模的每一变化，确定地产收入变化的平均数， 
便能眵得出依据地产规模树料预测地产收入状况之 各种可 鏡的預 
餚中最好的 _ 个。 刚 才指出 的类似比率，如在地产规模一个因素 
变化的条件下地产收入波动的平均数,称作回归系数。在一般情况 
下， 回归 系数规定因变量或结果变量在自变量即原因变量一个变 
化下变动的平均数。 ■ 

但是，消除被分析现象中不适宜因素影响的两种方法，光 
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论是 分组 法还是确定平均达法对于历史学家来说，都不是 全新的 
方法。历史学家们在自己的研究著作中经常使用这两种方法， 
只是没布使用它们的名称——编辑组合逢缉表册求-_数6但 
是， 把历史孪家完全比作莫里哀喜剧中 , n 散__然不知的著 
名主角①并不恰当，因为运用两秤方法&技巧，尤其按照数学的全 
部原则运用两祌方法消除“不适宜成分”的影响而得出的主要结 
果，与原来历史学家们运用的方法以及得到的结果并不一样 。臀 
如，不掌握数学方法的历史学家所求的地产规模与收入间平均 
比是具体的地产规模与收入额间的 平均算术比， 即是说,他求的 
仅仅是已知的收入总额与地产规模之间的比率^以这种方法求出 
的平均比具有一定的理论和实践意义。但是，如果依据这个比率 
由地产规模预测地产收入，那么我们就不能从所有可能的预测中 
得到最 好的一 个^借助回归系数才可能得到最好的预测。 

借助回归系数进行预测 

为了正确预测，必须了解回归系数《如何确定回归系数？为 
回答这一问题。我们根据表5的材料确定出以下的曲线。 

曲线 AB 称作 经狯回归线， 它根据10份具体地产的衬料绘制 
而成，并且表明，这10份地产中的每一份其规模与收入有怎样的 
比率。不难证实10份地产中每一份规模与收入之比不同，第一份 
地产1俄亩收入为1500:240 = 6*2卢布，第二份地产1俄亩收入为 
1250:255=4,9卢布，第三份地产为1550:265=5，8卢布，等等。贵 


①这里指莫里哀軎剧《贵人迷》中的主角汝尔丹。汝尔丹是巴黎一个不学无术 
的茁商，一心想当贵族。他被人耍弄，还自以为乐。 为了附藉风雅 ，他想学 
习散文，哲学教师指出他说话用的就是散文，他大为惊讶，天啊〖我说了四: 
十多年散文，一点也不晓得〖 ' 译注 * 
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贵族土地锒行有 3*3 万份保存完好的地产材料，其中每一份几乎 
都有同 i 样精确的关于规模与收入的记录，因此二者之比都能计算 
出来。 

而与曲线 AB 相应地可以设一条直线^ _ _一_表^3假设 
影响收入的其他因素不起作用时，与其规模变 Ifeli 联系的10份 
地产（不是单独的每一份地产！）地产收入变化的平均敝，这条直 
线称理论回归线，根据实际地产规模由这条线预测的地产收入 
值，相应地称作理论收入值。 

理论回归线是^ 折衷”线， 它与经验曲线 AB 上任意一点都 
最接近，但又未重合。若每个一定规模的地产收入实际值与由回 
归线预言的同一规模地产收入值偏离差最小,就达到折衷。所谓 
折衷，仅是对 总休、 養 体 而言，它也不意昧着理论回归线上每一 
点在任何情况下都最接近经验间归线。为验证这条线，数学家研 
究出被称为“最小二乘法 H 的专业方法。 

理论回归线总是可以通过 J 3 归方 程用数学语言表示或描述。 
在地主地产的例子中，直线方程式与理论回归线相符合，因为收入 
的理论值在直线 CH 上,或者象数学家所说，回归是直线的。方程 
一般可以这样 表示 ： y = a + bx t y 为因变量在理论回归线上的理 
论値（在谭例中，是由地产规模决定的收入理论值），是方程 
中的自由项，&为回归系数， x 为自变量值（该例中为地产规模）。 

回归方程中的参数值（项）是怎样的？ 

参数&在回归方程中称作回归系数。它总是名并且是具有 
_定意义的值 * 因为它证明，在自变量（ X )的一个变化下，因 
变量 （ y ) 对于所现察的全部因素平均变化到什么程度。在19世 
纪末地主地产的例子中，闽归系数为 + 0.00606, 即是说，地产 
规模增加1个单位，即培加1俄亩，收入将增加 0.00606 个单位，或者 
增加 o.ooeoex 1000卢布 = lo 6 卢布。如果回归系数为一 0,00606, 
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则说明地产规摸若增加 〗 俄亩,收入将 减少 卢布。,,； 

当回归系数为正数时，因变量与诌变量之间是正比关系：因变 
量值随着自变量的增加而增加，或因变量值随着自变量 f 减少而 
减少。当回归系数是负載时，变量之间当自变 
M 増加时因变 M 减少，或自变量减少时 


参数 a (方程的自由项）自身无值的意义，它仅标出坐标系 
屮回归线的起点或回归线与 y 轴的交点。 

—切求直线回归方程式所必需的计算，都接近亍算术四则运 
算。例如，依据并不复杂的公式就可算出回归系数： 

^(xy)-nxy 


by-x 


— «(^) 2 


x 为内变景， y 为因变 Ms $和？即 x 和 y 的平均箅术值，《为所观察 
的 x 与 y 的样本数， Z 为求和符号。 

应该记住，在此基础上求出的方程式与回归系数，完全可以 
根据标准稈序在电子计箅机上迅速计算出来。但是历史学家运用 
电子计算机汁算回归系数（或计算任何系数）有很大的缺陷：他们 
有时会忘记，这些系数是怎样得出的，它们的纯数学意义是什么，： 
这时常会阻碍从纯历史意义的角度对回归系数进行阐释。正因如 
此，我们有必要详尽考察系数意味着什么，以及如何求到系数。 

借助最小二乘法可以得出回归方程参数，然后确定理论回 
归线，该线表示依赖于地产规模的地产收入变化 趋势， 或表示荣 
因素制约的具有结果特征的■一般变化。用这种方法也能得到0归 
系数，这样得到的系数表明 10份地产 （ 如果历史学家处理的是 
100份地产材料，则是对 too 份地产而言）在其规模每变化一个单 
位的条件下，地产收入值的平均变化。借助回归方程就可以预测 
任何规模地产的大概收入。 

对于19世纪末地主地产的课题，最小二乘法提供了理论回归 
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表 


S 世纪末俄'国贵族地产根据规模预釀的收入值 


模(俄亩) 

1 

2 

3 

4 

5 



8 

, 9 j 

10 

240 

255 

. 

I 265 ； 270 

2S5 

2 水 

310 


326 

330 

实际地产收 
入(千卢布) 

1,50 

1.25 

1 

U5S 

1.40 

U46 

1.60 

1.80 

1,80 

‘ 

1-S5 

1.90 

根据闾归方 
程式预测的 
地产理论收 
入(千卢布) 

1.31 

1,40 

— 

-0.15 

1,46 

1 

1*49 

1.58 

1.65 

. 

1,73 

1.79 

1.83 

1.86 

地产理论收 
入与实际收 

入之差 

0.19 

0.09 

- 0.09 

-0.12 

"0*05^*07 

1 ^ 

1 

0.01 

- 

0.02 

' 

0,04 

裉据地产收 
入与规模之 
间平均算术 
比预# j 的地 
产收入 

1.33 

1.42 

1.47 

1.50 

K58 

U64 

1.72 

, 

1.78 

KS1 



根据平均算 
术比預 W 的 
地产收入与0*1了 
实际收入之 I 
差 


-0. 17°0.08 




- 0 * 10 


一 Hi G.04:0.08 fl 


0,02 ft [0.04 J 


0.07 


«预测不如据回归方程所做准确。 

钱方程，该方程描绘出地产收入 （y ) 与其规模 （x ) 之间的联 
系 I 〜=— 0.14379 + 0.00606、我们将地产规模值 （ Jf ) 代入 
方程，得到地产收入 Ch ) 的理论值，进而比较根据地产收入与 
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规模之间平均算术比求出的地产收入值与地产收入理论值(.衷 6) a 
由上看出, 回归系 數可以用最好的方式确定变童之间的关 
系，而囲归方裎则有助于得出依据自变^的最好的预 
携 U 贵族地产的事例验证了这一点 。 f 

如果用简单算术法确定这10份地产与规模的平均比，为 
1俄亩5_56卢布。依据这个平均比计算10份地产的大概收入，并 
且找出它们与实际收入的差别 （ 参见表6 

将分别根据平均比 5. 56和回归方程 h = -0.14379+0.60606 
* 算出的两个收入值与地产实际收入值比较后发现，根据回归方程 


算出的收入，10个中有7个比裉据 5.56 比率算出的收入更接近实 
际收入。与历史学家经常便用的求平均算术比的方法相比，该例鲜 
明地显示出确定因变量与 S 变量间关系这一分析方式的优越性。 

如此看来，表示在自变量每一变化下因变量的平均变化的回 
归系数，对历史学家来说并不是新发明。可以说，历史学家运用 
回归系数，第一，可以总结其研究实践，第二，可以提高所确定的 
因变量与自变量间平均比的精确性，第三，可以完全清除掉不适 
宜因素对结果变量的影响。 


回归系数如何帮助历史学家 

回归系数在历史研究中具有重要的意义，因为它能确定任何 
一个受其他囪素制约的指数，从而在缺少材料的情况下进行预测。 
这对于历史学家来说十分重要，因为他们 感兴趣 的材料时常告 
缺，虽然近似的材料可以帮劢确定这种指数，但并不能圆满地解 
决问题。 

例如，在1801 — 1860 年期间，俄罗斯许多省份未保存下有关粮 
食价格的村料。似根据一些省份关于收获量 （ # ) 和粮食价格 O ) 


- 




的材料(有些省有类似的 材料乂 耸出了表示诸宵依赖于收成 ;K 丰 
变化的粮食价格平均变化的冋归方程式。根据材料一 1810年 
粮食价格回 岿系救 等于一0.594，1851 — W60 年等于 一0U077 等 
等。如果一些省份有收获量的材料 TM 未保留下粮食价辦的资料， 
就可以 （ 当然是近似地）根据回归方程来确-定赏^分§1801 — 
1810^1% 1850—1860年的大概的粮食价格。方程钎^的 
价格偏离实际价格10—20篼，这是实际价格5推测价格之比。岡 
样，在贵族地产收入与规模的例子中，计算出回归方程，就可以在 
缺乏地产收入资料的情况下，根据地产规模椎测地产的近似收入。 

K • B •赫沃斯托娃在研究14世纪拜占廷农 K 的状况时，诰 
助冋归分析，判明了税收幅度取决于农村纳税人数量及其财产规 
模。据此，她预测了那些未保存下有关.史料的乡村和农户的大概 
税率。① 

但是，问归系数的意义并不局限于借助它来预测所缺乏的材 
料。回归系数之所以重要还因为> 它以事实为基础，简明地高度 
概括出关于事实的概念。在粮食价格取决于收获量的例子中，冋 
归系数等于一0.594,这一系数在概括许多数量统计材料的基础 
上证明，在 1801— 1810年，一呰省份收获量平均数自身变化1个 
单位，则粮食价格大约每俄石②变动59 .4 戈比，或者说， 某些饵 
份1谀亩粮食平均收获量变化1普特，价格变化接近7戈比。 

科瓦利琴科运用相同的方法，成功地判明了，在19世纪 
上半期俄国劳役租制农奴地产上农民经济水平 (30 与农民贡賦量 
( r ) 之间存在着依从关系，这种关系可表述为方程： V -0-56 


① K * B ■ 赫沃斯托娃^拜占廷晚期土地法律关系的特点 (14 一 15世纪英斯 
科 1968年，第 121—123页 & 

© 俄石为俄国旧容量单位，裝散体物等于 209 .n 升，装浓体物等于 3. 0748升 
-^译法 a 
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_2.37 h 回归系数 ™2.37 表明 ，农 民经济的贲陚每增加 i 个弟 
位1、 卢布，农诗经济水平就减少 2 . 3 7个 单位；即减 僻: 3 7 头牲 

畜。① ... . - 


齒归系薮揭示出0变擞与闵变量间的数 fi 关系性遗，它能眵 
依据^个变量值预测另一个变踅值。 


预测屮的锫误 


但正如所见，根椐 M 归九程预测的因变量僧:也不准 8L 在贵 
族地产收入与规模的例 T 中，10份地产的理论收入与实际收入之 
差 分別如 K: 


地产 

收入笠 

地产 

收入屉 

I 

0-19 

6 

— 0 * 0 0 

2 

-0.15 

rr 

0* D 7 

3 

0 -09 

B 

0^01 

4 

— 0.09 

9 

0-02 

5 

一 0 . t ? 

10 

0 .04 


地产牧入实际值与 押论值 的差別 (: 被称作余差成余数），受除 
地产规搜以外的其他因素制约。在19世纪末愀国的具体条件下， 
后吞也影响着地产收入，但我们未特别考虑这一点，因为我们的 
目的正是耍消除地产规模以外的一切因素对地产收入的直接影 
响，观察地产收入仅仅依赖于规模如何变化，而事实上，地产收 
入毕竞处 f 上质、’农艺水平和其他许多被我们忽略未计的因素影 
响之下。因此，仅由地产规模确定的地产理讼收入与受其他许多 


① H * 只■科瓦利 琴科： 《19世纪上半期俄国农奴制农民》,英斯科1恥7年， 
第321贝， 
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® 索制鉍的实际. 吹太 充问 / 这十分自然 W …_ 

i 关关系与函激吴系不同。一个 貝突童 几乎在任何时候都不 
铺¥对准确地预测因变童。间时，一个自变量或一个因素特征也 
不能阐释因变量的一切波 动和一 切变化。由此自然产生出两个问 
題：第一，板据抽样材料，即由历史学家$据的现有材私， _ 依 
自变量对因变置所做的估计或预测，精确 _ fl %? 二，\与 
自变量变化相联系的因变量变化了的部分， i 变怎样的？或 
自变量 （ 原因）影响因变量 （ 结果）的糧度是怎样的？ 

有专门的数学指数—— 估计标准*差 （ 7 ■ X ) 和相关指数 
< o 来回答上述问題。估计标准误差(在我们的例子中用来测 
定根据地产规模预测的地产收入值的精确性和可靠性） 概 括地表 
明在抽样材料基础上拫据自变量預 i (因变量的准确性。 这样，估 
计标准误差就能检验出所编 制的回 归方程的正确程度。 相关系数 
(在我们的具体事例中， 指出 受地产规模制约的地 产收入 部分以 
及除此以外与其他未计的剩余因素和联系的地 产收入 部分）概 
括地测定出受自变设制约的因变置 的变差比例。 相关系数将在下 
一 章详细 考察， 现在，我们首先介绍估计标准误差。 

确定根据一％方程 y = + h 计算得出的 B 变量值佔计标准 
误差，依椐下例 S 式： 



sy ■ X 为依自变量变化的因变量值估计标准误差, * 为因变 fl 实 
际值 （ y ) 与理论值 （h ) 之差> 2为求和符号，/!为所考察的样 
本数量 P 

在由份贵族地产组成的抽样中，地产收入估计标准误 差为： 

(0.19) 3 + (_0 -15) 2 + (0-09” + ( — 0.09) a + ( — (M2) 2 
+ (-Q ， 05) a + (0.0 7) a + (0.0 1 ) 2 -f (0 ， Q2) a + f0-04) a 
~~ 10 … ^ ^ 


以， 














=~^^=10994千卢布= 99 4卢布® 

正如所见，估计标准误差不是别的， 正〜是 受未被回归方程阐明 
的其余因素制约的地产收入偏离由回归方程阐明的因素制约的地 
产收入乎均数的平均平方羞，或者说，是地芦榮际收入值_离依回 
归方裎 O . U 3 S + hO (^ OM 算出的理^入值的乎_方差。 

这样，根据回归方程计算的10份地的地产收入估计标 
准误差即为 0.09 S 4 千卢布。根据回妇方程 y =_0.1438 + 0 .OOeOS 
6可以确定这10份地产样本之外所有地产受其规模制约的收入 
的大 概败宇 。但是对于样本以外的地产，根据这一方程预测的收入 
平均值与地产实际收入值的偏差，看起来大于样本估计标准误差 
值 0.0994 千卢布。为什么？因为样本只是近似地反映总体即所有 
贵族地产的规律性；并且样本的范围越小，总 体固有 的关系能够被 
样本发现的程度越差。可见，历史学家研究的地产样本份数越 
少，根据地产规模预言的地产收入样本估计标准误差与总体估计 
标准误差之间的羞别就鱸大。 

确定依自变董变化的各个因变量，即依地产规模而变化的各 
份地产的收入值，与地产收入总体的误差，根据下列公式《 



»为抽选的因变量（地产收入）实际值与理论值之差；》为地 
产样本数； 奸 ^为因变 MC 地产收入）样本估计标准误差。 

在我们的例 I 子中，由10份地产组成的样本估计标准误差等 
于 0.0994 千卢布。 而从 总体范 围着， 如果根据回归方程式 y = 
— 0*1438 + 0 *00606* 计算出俄国19世纪末每一份贵族地产的收入 


© 其中计算有误一译注 | 
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额，然后将这所冇理论收入值同对应的实际收入值进行比较，則 
二者平均差计算如下《 

I . . 7 : .瓦. f - ■ 

、/ 0 . 0994 s 05 千卢布= 105 卢布 。 

因此，借助回归方程，根据自变翬估 计韵因 变置兀麥总是有、 
错误。但是，必须区分样本诂计误差与总体估计鸟如所 
知，即使抽样的树料具有代表性，也不能完^准 _ 兩地说明总伴的 
特点。因此，因变量的样本估计误差与总体估计标准误差总是不 
同。但是样本标准误差却可以确定总体标淮误差。后者大> 
于前者 并且抽 样的范围越大*样本 与為体 的估计标推 
误差区别越小（不要把差值与估计标准误差值混为一谈，后者随- 
着袖 样范围的扩大而缩小 I )。普如，考察32份地产，修正值为 

f S — "" —— • - — 

V ^^ T "" 1 . 03 ， 而考察 100 份地产，修正值为 . 01 " 

正如巳知，根据地产规模预测地产收入是以回归方程和回归 
系数为基础。同样，回归系数的可靠性 也依赖 于抽样的范围 。梯 
样范 ffl 越大，即样本所代表的总体的特点越多，则样本回归系数 
错误 a 小，样本系敎与总体系数的差别越小。 : 

确定袖样样本数超过川以上的回归系数估计标准误差，依据 
下列公式 I 


Sy*x 

Sbyx ^^cVn 

为回归系数标准误差 s Sy ■: c 为因变量 （ 地产收入）总体估‘ 
计标准误差，或总体样本与抽样样本误差修正值的标准误差为 
自变量 （ 地产的规模）的标准误差；《为抽样样本 （ 地产)数科。 
柄如，袖样由 50 份贵族地产组成，给出数字卜4 = 0.0175, &.二 

再依据上述公式，即求出回归系数平均误差： 

- ■ ■■ …乂 - L - 














1 -10 


0*0047 


~~ 33^50 

' 如此看来，历史学家依据回归方程不仅可以涮定所缺乏的数 
宇，同时可以预测测定出的数字的可信程度。尽管这类预测并不绝 


对准确，但对于历史研究，尤其对于以统计材料为基础_研究， 
具有重要的意义。 f : 


简单与复杂的关系 


我们通过简单直线回归的事例了解了回归分析。所谓 简单， 
是因为只有两个变量，即自变量与因变量。所谓直线，是因为变量 
之间的依从关系是直接的与线性的：随着地产规模的增加，其收入 
也均 衡增长 * 随着贡赋额的增加，农民收入额均衡 减少。 由于变 
M 之间存在直线联系，因此变量的依从关系，可以被直线式的田象 
描述， 用数学方法表述 则是直线方程 Cy = a + fcjO P 应该注意到， 
直线方程时常能够很好地反映两个考量之间的依从关系， 甚至在 
实际失系比直线反映的关系更复杂也不例外。 

但是，简单的直线回归远非总能反映两种现秦之间的关系， 
B 1 为在某神程度上，这些关系的存在形式千姿百态。在这种情况 
下，研究者应选择符合变量间依从关系具体形式的线与数学方 
程。现象间依从关奉的可能形式以及反映这呰依从关系的冋归方 
程多种多祥，其中有简单抛物线与立方抛物线，双曲线，指数和 
对数的函数，等等。 

在苏联学者的历史研究中，为用数学语言描绘复杂的历史现 
象，时常运用筒单抛物线。 简单抛 物线反映这些形式的依从关 
系:随若 r : l 变量（ X )的增加，因变量 （ y ) 在一定点以前也增 
加（或减少），而后减少（或增加） i 并且在某种情況下二者的依 
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从关 系不均 衡：当自变量均衡增长时，因变量的变化则是渐进的。 
苏联学者为了用图象和数学方法反映 i 9一20世 纪初俄 国的收获 
量、出口、价格和某些其他经济指数的突动， f 利用了 籣单抛 物线。 

在类似事例中，自变董表示时间，因丧量表活收获量、出 
口、价格等等,例如， 1896 — 191 2年俄国粮食收获量总额动态 （y ). 
可以由简单抛物线表示，与此抛物线相适应的方 程是： ^ 

y=2AS7+5.7e7X — 0.0S94x z o 

同期的世界价格动态 （A ) 也可以由这一抛物线方程 

yj =—0,564 + 1 .956 + 0.0235JC 2 。 

俄国在 isoo — wu 年这 11 5 年期间收获量的动态 （ y * >，也 
可以用简簞抛物线描绘，而用数学方程表示则是* 

ya — 3-56 + 0 .018265C+0-000364X% 

在这三个方程中，自变量^表示以列入计箅年份力开始的年份 
的顺序数。例如,在表示收获量动态的方程中，以1800年为 I , 
那么，1810年即为¥=11 ,等等 9 

20世纪20年代，苏联研究者曾试图依据上述方程预测收获量 
甚至价格 水平。 

选择描绘复杂历史现象曲线的技巧，同寻找園归曲线方程的 
技巧一样复杂，然而要忠实于历史面貌，我们却不能仅停镡在对 
技巧的研究上。 

应该时刻记住，任何关于选择方程技巧的知识以及在计算机 
上工作的能力，都不能取代历史学家的分析，因为只有进行具体 
的历史分析，才能对方程得出合乎逻辑的和具体历史的论证，反 
映由历史学家在被研究现象和进程中发现的变化趋势。 

这样，当两个被研究变量之间表现出直接的、线性的联系时， 
当在自变量变化范围内因变童值 均衡增 加或减少时，历史学家可 
以用数学方法(直« 方®) 或图象方法(直 线） ，表示其间的关系。当 
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变 M 之间表现出曲线联系时，当随着自变量的蚤化，因变量或邊非 
均衡变化，或者非同义变化< 时而增加时而减少）时，历史学家 
邱以用双曲线方程、 抛 物线方程等表示其间的依从关系。 

在历史研究中运用回归曲线方程同运用冋归直线方程一样， 

可以借助数学方法反映历史现象之间的依从关系，从而使历史学 
家得以依据保存的 资料确定丧失的历史 资料的面貌， 当愁^ 这是 
近 似的。臂如，依据一些年份的材料，可以 I 确定份胃:_的 j 
收获蛩 ^ 反之，依据一些年份的收获量、出 P 或播 种面弗 t 厂则能 _ 

确定另儿年的收获量、出口和播种面积等。 

其次，枋史学家借助回阳方程，可以预 澜现象可能怎 样变化 
或诺如歉收一类事件的来临，®可以做出经济学和人口学的预测， 
就象在这两门学科中已经进行的一样。 

上述实例还证明，回归方程使历史学家得以从历史现象的动 
态中 发现时代的规 律性， 从而为历史学家开辟出揭 示历史 规律的 
更为广阔的道路与前景。 

历史学家除去与简单的直线和曲线的变量依从关系打交道 
外，还不得不经常与 复杂曲 线的依从关系打交道，因为在多数情況 
下，因变最的变化受到几个因素的制约，其中任何一个都没有决 
定 性的® 义。例如，专门分析表明，在 一 2 0世纪初，俄国粮食价 
格动态处于五个重要因素的影响之下：世界出 G 价格、粮食出口 
额、收获量、货币行情和货币流通量。而省一级粮食价格水平则 
受到其他五个因素的影响：从诙省到港口的距离、港口的价格水 
平、粮食的收交逋状况以及该省城市居民的西分比。 

对复杂历史规象进行回归分析是极为复杂的事情，因为它往 
往成为多芫 分析。 这种分析方法，实际上是要确定和从数量上估 
计因变量与每个个别因素之间的关系以及因变量与所有因素集合 
之间的 吳系。 通过多元回归分析，研究者得到完 全的、 纯的 1 或 
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部分的三种回归系数以及多元回归方程 a 

宪全回归系轚表明结果变量与每一个个别因素之间的依从哭 
系，这种依从关系是以消除因变量与诙因素以外的其他因素之间 
的直接关系为前提但是，完全回归系数未考虑到，每个因素不 
仅直接通过但身，而且通过其他因索间接地与因变量发生关系，因 
而能够间接地作用于因变量。结果，每一个完全回归系数不仅反暖 
一个因素同因变量的直接关系，而且反映因变量同那因 _j 
变量直接联系已被排除的因素的间接的、伴随发生的威裏 ji 关系 
与完全回归系数不!司，纯回归系数表示结果变量与每一因素 
之间的单独的失系，这种芜系“清除了”同其他因素之间各种直 
接的与间接的、伴随发生的关系。故称作纯阁系数。并且，它可 
以根据研究者的愿望，使这一结果变 a 依次“摆脱”与一个、网 
个以至所有进入回 in 分祈的闪 : m 间接联系。如果清除因变量与 
一个因素的间接联系，将得到第一级纯同归系数，如果沾除同第 
二个闽素的间接联系，则得到第二级纯回归系数，依此类推。 

多元回归方法的最大优点在千，它可以作假设试验。这对于 
完全失 去进彳 i 劣际实验可能性的历史学家来说极为重要 0 例如， 

历史学家通过进行假设实验一确定“纯回归系数％就可以估汁 
纯粹形式的现象之间的依从关系。而这是不可能通过试验彷制的。 

但是，多元回归方法 不是万 能的，因为它冇很大的局[^性。 

纯回归系数能够消除因变暈与参加分析因素之间的间接关系 。 M 
是，旣然 实际上 不可能考虑到所有的 因棄， 因而就不能全部 、而 
仅能局部地清除因变置与因素之间伴随发生的关系。 

因此，研究 巷不得 不满足于主要因素或者已知因素。在第一 
秤:青况下，正确地解决任务是可能的，而在第二种情况下却不一 
定，因为不能排除这种情况，未考虑的因素恰恰屋最重要的 。 m 
是，这一点研究者却总是可以知道： 他辦 于研究任务的确定与解 
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决，可以满意到什么程度。为此就必须建立间归方程，借助方程 
确定因变量俏，并且将方程预测的因变量值与实际值进行比较。因 
变量的预测值与实际值差距越大,任务解决得越不理想。因变量预 
测值与实际值之间存在的差距表明 t 研究者不可能注意到所有因 
素，必须进一步考察。与此同时，回归方程显示出它的另一个优点 
一能够验证分析结果，而这对于任何科学工作都是极为重翼足 U --,, 
因此可以说，计算多元回归方程的参数，不但家 y 
在技术程序上，都是复杂的，但是分析的结果会补填 
由于历史学家习惯于仅仅运用事实和仅仅研究实在情况的分析方 
法，因此对他们来说，上述某些方法是"大吹大攉"和“令人愤 
懑”的矫揉之作。但仔细考察会发现，第一，这呰方法已被事实 
证明是正确的；第二，这呰方法已为历史学家所了解并且时常被 
他们利用。例如，当历史学家谈到，在皇后亚历 m 德拉 * 费多罗 
夫娜的影晌下，尼古拉二世罢免了许多大臣的时候，就似乎已经考 
虑到纯囘归系数，进行了假设的试验。 

19世纪粮食价格是多少？ 

现在我们通过分析 19— 20 世纪初各种因素对粮食价格的制 
约，考察如何运用多元回归方法。前面指出 | 粮食价格动态取决 
于五个最重要因素。因而，反映 1801 — 19U 年间受这些因素制约 
的粮食价格 “ 行为”的回归方程 如下： 
y=2<3 + 0.53iJfi + 0 ,207^s + 0 . 229^ 3 + 0 - 00709^^ 

+ 0,0044 戈 s ， 

在这里， y 为具体年代俄国粮食的平均价格* A 为具体年代俄国 
货币总量； h 为上年世界粮食价格， h 为当年俄国卢布货币行 
^ h 为俄国上年和当年的乎均收获量> A 为当年粮食出 U 额, 
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2.3 为自由顼，它类似方程 y = a + 中的参数 fl ;0.53 l 为价格与货 
币总量的纯回归系数 0.207 为价袼与世界价格的纯回归系数等。 

该方程以最槪括的形式反映了粮食价格与价格因素之间的相 
亢联系 * 因此，它可视为19 一 2 0世纪初俄国粮食价格动态的数学 
槙型，我们把五个因素值代入固归方程，就得到相应年代的粮食 
价格。 _ 

借劢该方程，可以预测任何一年的粮食价格。因男 
1914年间大多数粮食价格是已知的，因此，将由回归方程预测的粮 
食价格同实际的粮食价格进行比较，就可检验已建女的粮食价格 
动态方程的正确程度。将粮食价格的实际值与理论值进行比较后 
看到，方程预测的价格平均误差为± ^嗨。这可以认为是满意的。 

由于粮食价格动态方程“工作”得令人满意（预测的误差不大）， 
可以 断定， 1801 —1914 年粮食价格动态模型编制得相当不错，粮 
食价格“行为”确实主要受到所考虑的五个因素的制约。 

怎样才能阐释反映粮食价格同五个因素关系的多元回归方程 
中的纯回归系数呢？ 

五个纯回 H 系数中的每一个都丧示，假定参加因素分析的其 
他因素不变的情況下，每一因素值增加一个单位，则粮食价格将平 
均地均衡增长 （ 因为我们这 M 是直线方程，而且所有系数均为正 
偎）。例如，“货币总 ft ” 的纯回归系数就意味着，1 S 01 — 19 U 年 
间，随着货币总量增加1唤，在其他四个因素（收获量、货币行 
情、世界粮食价格、粮食出口 ft ) 依旧不变的情况下，粮食价格平 
均增洵 0*53 笏，世界粮食价格”纯回0系数表示* 1 8 01—1 9 1 4 年 
间世界粮食价袼增加1 资 ^在其他四个因素值 （ 货币总量、货币行 
情、收获量、粮食出口量）依旧不变的条件下，俄国粮食价格则 
平均增加 0. 2 够9我们注意到，粮食价格及苏因素的变化 以百分 
比的形式反映出来。原因在于,该回归方程是以用百分比计的相对 
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数目为基础编制而成的。而如 果因素 值以每一因素固有的绝对数 
0计，即世界价格、货 币总蛩 、货币行情以卢布和戈比计，出口额、 
粮食收获量以普特计，那么回归系数将与因素同名，_即以卢布、 
普特计，并且将根据以卢布或普特为单位的因素值的变化，以若 
千戈比表示价格的乎均变化。 

在 U 01 — UU 年的俄国经济生活中，粮食价格动态的&个 
因素共同且冋时起作用 & 它们的影晌错综交织， 其^ ^5 
通过自身，而且通过其他因素，影响粮食的价格 & 例貧 h 一货币总量 
与粮食价格发生依从关系就不仅通过其自身。俄国卢布的货币 
行情通过货币总量影晌价格，因为货币总量与货币行情相互联 
系 & 粮食出口通过自身，同时通过世界粮食价格和货币行情，与 
粮食价格发生联系。同样，粮食出口与货币行情通过世界价格与 
地方粮食价格的相互作用，而粮食出0、世界价格和货币总量通 
过货币行愦与粮食价格发生依从关系。因为这五个因素互相作 
用，所以其中每一个因素任何时候都没有同粮食价袼的 "纯 "联 
系，都不能在因素值不变的情况下，脱离其他因素单独起作用。这 
样，所谓純回归系数只是假定的。便每一因素人为地联离其他因 
素，可以显示出每一因素同粮食价格的真正联系。 

完全冋归系数考虑的是每一因素同粮食价格相互联系的总和 
( 该因素同粮食价格的直接关系以及其他因素通过该因素与粮食 
价格的间接联系 h 后者表明在考虑其他因素通过某因素与价格相 
互联系的情况下，粮食价格与诙因素的联系。因此,完全回归系数 
反映诙因素同粮食价格的直接关系以及与这一因素联系着的其他 
因素 （ 不孤包括我们分析中考虑的除它而外的其他四个因素，而 
丄1 包括未参加分析的其他所有因素）同它的间接关系。 

将纯回归系数与完全回归系数进行比较，使研究者一方面能 
够查明粮食价格同每一因素单独的 、纯 粹的相互关系，另一方面亦 
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能査明粮食价格同其余因素经过该因素而起作用的 



(见表 7 )。 


*7 i 8 G 〖一 年俄国粮食价格与价格因素之间的完全 


回归系数与纯0归系数 


粮食价格因素 

纯回归系数 

完全回归系敢 

差 

货币量 

0.531 

0.654 

0,123 

世界粮食价格 

0,207 

0.315 

0,108 

货币行情 

0-229 

0.336 

0.10? 

粮食收获 

0-007 

0.008 

0.001 

粮食出口 

0,004 

0,052 

0.048 

总 计 

0*978 

1,365 

0,387 


从表7看到，所有纯回归系数的绝对值都(但不是永远)小于 
完全回归系数，并且二者的差越大，则系数时绝对值越大。壳全 
同归系数总值超过纯回0系数总值约为一半^由此应得出结论，完 
全回归系数 （ 在我们这个具体事例中是 1801— 1914年俄国粮食价 
袼同其因素的相互关系)约三分之一 (0.3946:1,365) 反映了粮食 
价格同其他因素的间接关系，而其余三分之二 （0.9785:1. 365) 反 
映了粮食价格同其因素的“纯"相互关系。 ， 

用纯回归系数所研究的价格比用完全回归系数研究的价格更 
为 ■*/ 因为借助前者，可以确定因变量与每一因素的纯关系。 
因此，按其可能性来讲，历史分析更接近于诸如物理学家、生物学 
家为解决复杂的或多元的依从关系问题而在实»室 条件下 所进行 
的分析。事实上，在实验室条件下，除去其作用正被研究的 一个' 
变量以外， 一切变 麗都将固定在一个水平或数值上，因而可以将 
它们看作常数，或者在实验中不考虑其彩 _。 因此，实验结果是 
铒为仅存的一个因素的变化而形成的^例如，在进行气体实验时， 
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可以保持常温，而后试验气体在各祌压力下的体 fejs 后可以蘇 
持尚定的压力，试验气体在各种温度下的体积。生物学家研究药剂 
对家兔机体的影响时，可以取只有一个特征不相同的两组家兔， 
让它们服同一剂量的药剂，以此确定这一不同的特征对实验结果 
的影响。在历史分析中不可能进行类似的实验室观察，纯回归系 
数则向历史学家提供了研究因变量同排除了其他因素作用的—个 
因素之间关系的可能性。 

但是，亦不应该轻视完全回归系数，因为对历史学家来说， 
不仅现象的实质（由纯回归系数表示）永远具有重要意义，而且 
与生物学家和物理学家不同，那些现象的表象，以及人们不是用 
数学观点观察到的、而只是感 觉到的 东西，也总是具有重要的意 
义。研究社会生活的历史学家也应该考察人们的错误概念、错 
觉和谬误，因为它们给人们的社会生活和行为以巨大的影响。 

研究复杂依从关系的历史学家，不是对全部因素而只是对一 
个因素感兴趣时，完全回归系数很有意义。为了考察结果变量同 
一个因素的相互作用，应当把其余的因素油象化，尤其重要的是 
要确定这一因素同因变 M 的所有关系，即这一因素同因变量自身 
以及因变 M 作为 影晌其他因素中介的关系。 

实际上，在社会经济现象简单同归的所有情况下，即当分析 
一个因变量与一个自变量的回归 （ 请回忆一下地产收入依其规模 
变化的回归方裎）时，回归系数都是完全回归系数，因为未排除 
出分析的其他因素，通过参加分析的唯一因素，都加入到与结果 
变量的依从关系中。在关于19世纪末贵族地产规模与收入的事例 
中，除地产规模以外，土质、轮种等等都影响到地产 收入。 在因 
素分析中未考察的这些因素，通过地产规模，在一定程度上与收 
入发生依从关系。例如，土地规模越大，收入越高》收入越高，进 
行农业技术改造的可能性越大。于*农业技术经过地产规模，与地 





产收入发生关系，并且完全反映在充全回归系数 m 上，如此 

■ i 一一、 

’但当历史学家分析所有的、或者尽可能多的依从关系时，用完 
全回归系数估计的每一因素的“两种表演”(直接的与间接的关 
系一译注）就变得模糊，因变量与其因素之间关系的实质就变 
得畸形 a 我们想象一下，在表示粮食价袼与其因素相互作用的多 
元回归方程 2. 3十 0*5311 +0,207^2 + 0.229 X 3+0,0071*4 
+ 0.0044 A ) 中，如果以完全系数来代替纯回归系数，那么因 
素和粮食价格的相互作用将由于同一个 （ 这个或那个）因素与价 
格的依从臾系被考 察数次 而褒到 歪曲。 本来，货币总量与价袼的 
相互作用可以由货币总量的纯回归系数 0- S 31 耷全代表。但如果甩 
完全回归系数估计这个相互作用，那么因为已表明货币总量通过 
其他因素与粮食价格相互作用，所以，货币总量与粮食价格的关 
系将在其他因素的完全回妇系数中被重复。结果，货币总量与粮 
食价格的相互关系就被歪曲。由于其他所有因素的完全回归系数 
都有类似的作用，所以，粮食价格同其因素的总关系将被回归方 
程歪曲近 S 0 场，也即完全回归系数与纯回归系数总和之差， 

( 1 ,365-0.9785 ) ：0,9785, 

下面谈谈关于计算多元回归方程、方程参数以及关于估计方 
程误差涉及的问题。很显然，所研究的所史现象越复杂，回妇方 
程也越复杂，并且依因素数目的增加，计算所耗费的力量不是按 
直线而是按 双曲线 増加。 

研究者应当时刻记住，正如在简单回归中一样，在多元回归中 


由方程求出的系数是抽选的，与总体样本回归系数不同，因此必须 
估计回归系数的误差以及真实系数即回归系数总和的置信区间。 

除此而外，研究者还不应忘记,正象在简单回归中确定的因变 
量理论值一样，根据多元回归方程确定因变量或结果变量的理论 
值也与实际不相符合。在这里，因变量也有剩余部分，即所考虑 
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因素未阐明的因变 M 变差 。 因此，研究者面临的任务是硫定因变量 
受其因素影晌的估计误羞。 

正象在简单回 0 中一样，多元回归系数的置 值区间 （可从其 
他样本中得到的值的区间）也取决于抽样 样本的敝量。 考察的样 
本越多，真实的回归系数确定得越精确，样本回归系数与总体回 
归系数之差越小。 ■ 

应当 av 意到，根据专业公式（在任何一本统计学的教科书中 
能很容易找到），无须解方程组，即可求出样本的回归系数样， 
根据专业 公式，无须 逐个计算因变量实际值差， 也 可求出样本估 
计的标准误遐0 

因此，运用回归方法分析复杂、多因素的历史现象，如分析 
简单现象时一样，分析的“战略 M 同样是，研究者以逻辑的、具 
体历史现象的分析为基础，选择一个或几个因素，然后计算出回 
归系数，并估计系数的精确性和可靠性。然而分析的“策略^则 
有很大不同，因为历史学家不得不利用相互作用的因素，清除它 
们的相互影响，并且对每一因素的纯意义以及所有因素的综合意 
义加以估计 o ' 

对于计算回归方程和回归系数技巧的研究，不属于我们的任 
努 。因为 历史学家可以冋避和 不掌遐 这种专业技巧 。电 子计算机可 
以成功地完成计算工作。然而电子计算机虽冇如此神通，但就象已 
多次指出的，它郎不能使历史学家摆脱对所选择因素进行逻辑 
的、具体历史的论证，对这种或那种形式方程的运用 5 以及对所 
求出的回归系数的阐释。电子计算机可以计算出需要的方程与系 
数，但是，只有研究者才懂得系数是 如何得 到的、系数在数学上 
和具体历史上 意味着什么， 才能研究明白计算结果。 

如此看来，历史学家有必要去选择直线或曲线，/有必要花 
许多时间揭示数学依从关系以及计算他所研究的现象与事实之间 
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关 系的回归方程吗？回归方程提供了预言与复原丧央&班史材料 
的可能性，它以概括的形式反映出历史现象或事实间数量哭系的 
性质， 揭示出历史现象动态中隐含的时代规律性，历史学家通过 
对反映这种或那种社会经济现象动态的曲线与直线方程的比较， 
发现社会经济现象的异同，并据此揭示出其间的因果联系。掌握 
预测的能力，使切史 学家在 估计所研究历史现象与进程的意义 
时，得到 了比运 用传统方法更多的可能性。 

这样，我们对于本章的标題“历史学家能够预测吗？”作了直 
接与可信的回答。历史学家能够而且应该进行预测。预测那些将 
要发生 的和很快能够发生的事情。这种预测通常就是推测事件将 
如何按照由历史学家发现的事件发展趋势以及由他揭示的规律性 
来进一步发展。显然，这种预测不可能是绝对准确的，但是它给 
人们指出了必然发生的前景。这样，人们由于了解事件将可能怎 
样发展而感到坦然。 ' 

但是，读者也许会说，本章前面例举的关于酿酒的规模、粮 
食价格、地主收入以及其他小事的预测，与对将来社会发展的总 
体预测街什么关系？回答是：从简单到复杂。从原则上解决预测 
可能性问题,并从小事着手，随后我们将进行大型的、综合的预测。 



第四章令人信服的系数 


( 相关方法在历史研究中的应用） 


历史学家早已运用了相关方法 
的“工作”原则 

我们已经阐明，预测的基础是要了解所研究的现象之间的依 
从关系。这种依从关系与一种现象对另一种现象的影响程度紧密 
相关，因为它取决; P 这种影响程度。 

对十因素影响结果的程度作出量的分析，是任何科学分析的 
中心问题。无论视历史为缪斯或是科学的研究者，都同意这种观 
点。因此，运用数学方 法研究 历史，对历史研究中所分析的因素 
作出数量估计，其重要性无须再加论证。 

本章将阐述历史学家运用相关系数测定因素对变量的 彩响程 
度 问题。为/熟练地运用相关系数，并且能够用历 史方法 正确地 
阐释相关系数，必须首先了解相关系数是什么；它是如何计算和 
产也的 f 它在数学上和逻辑上具存什么意义。 

在上-章已经说明，对于依-个或一些作为自变量的给定因 
素而変化的因变量，如何运用同归分析作出预测或估计。通过回 
归分 析得到的方程 或回归系数， 使研 究者能 够淸晰 地确定 因变量 
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或结果变量与其因萦之 间鼹置 关系的性质，确定因变 k 族拥絮 f 
一变化而变化的情況。 

我们也已经说明，因为历史学家及丼建立的回归方程不可能 
考虑到制约社会经济现象和进程的全部因素，所以，由问归方程 
预测的因变景值有误差。比较由回归方程预 测的因 变量的理论值 
与实际值，就发现二者总有廣异，即估计误差 s 

对变 M 之间的关系进行回归分析，可以得到三种不 M 的值， 

I. 真实的、或实际的因变董变差， 它需要以因变量每一个别值 
与因变量平均算术值之偏差的平均乘方 sy 2 来测定； 2. 明确的 H 
变量变差， 受在分析中被考虑到的因素的制约/它需要以因变量 
各个理论值句这些理论值的平均算术値之偏差的平均乘方来 
测定； 3. 不明确的因变置变差， 受在分析中未能考虑到的因素 
的制约，它需通过由回归方程预测的因变量理论值与实际值之趋 
同这些差的平均算术值之偏差的平均乘方 sV 来测定。 

显然，因变 M 明确变差与不明确变遨之和即是因变 R 的实际 
变差，也就是： 

1 2 + ssf a = 5^ 2 (> 

而因变证明确变差与变盖总和 （ 即实际变差 j 之比表明，因 
变量变差的多少份额（即比例）受明确变差的制约\即是说 2 : 

2 表眾因变 M 明确变 k 在变差总和中的比重。这个比率* 



被称作决定系数，而这一系数值的平方根，就是冇名的相关系 
数： 



在1 9 世纪末貴族地产的例子中我们有收入实际变差 （W 
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^8*53, 收入明确变差 （h ) — sy ，= 6.58， 收 

(a ) —s/ = 2.00 ， sy 2 = syj 2 + s^ = 8*58 = 6*58 + 2^00 # 



所以，地产规模与收入之间的相关系数等于 0.88。 这意味 
着，地产收入约 77 铬 （ 0*88 2 ) 取决于埤产规模， 23 唤 （100 — 77 ) 
取决于其他因素。 

在因变量与自变量之间为曲线关系的情况下， t 被称作相 

关比或相关指 «( 它的平方被相应称作决定 指数。 如果 

因变量与其自变量因素间有直接关系，即随着因素值增加因变量 
值也增加 （ 在图象上回归线上升），那么就是正相关，相关系数为 
正号。如果因素值増加因变量减少 （ 在图象上囿归线下降），就是 
负相关，相关系数为负号。相关系数所使用的符号，同回归系数 
所使用的符号一样。 

在变量之间为曲线关系的情况下，因为随着自变量值增加， 
因变量值有时增加有时减少，所以相关指敢就没有符号。为了求 
出因变量各个变化方向的数据，有必要详细考察回归曲线的各个 
区间。 

取相关系数值为 一 ！ . 0到+ 1 . 当一个因素能说明因变量总 
变差时，因变量理论值（由回归方程预言）与其实际值相同，并 
且经验回妇线与理论回归线重合。 

因为因变量实际值的平均平方差恰好等于因变量理论值平均 

平方差：抓网者之比-^ 1 ^-。！，因此相关系数将 

sy * 

等于1.0。类似的依从关系，即当一个因素制约着因变量所有各种 
变化时，称作完全柜关，在这种情况下，相关系数为 r = + 1.0 或 
r ^-1- O , 相关指数没有符号，为77=1.0。 、 
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在上一章关于播酒所消耗 #物 取决于酿酒生产规模的事鲥 
中，己经查明，酒精生产百分之百地决定着谷物消耗，在这种情 
况下相关系数等于+1，即是说，酒精生产规模与谷物消耗完全 
相关，前者是制约后者的唯一因素。 

另一个汲端则是，因变量与自变量之宪全瑰有依 H 关 1 赛。 
因变量变差绝对不受被考察因素变差的制因續 （ d 取 
怎样的值，因变量所有理论值 （ h ) 都相同为因变董的 s — 
k 值适合于因素的所有值。在这种情况下，因为根本不存耷因变 
量理论值变差，其平均平方差就等于0 ,而因变量理论值平均平 
方差与实际值乎均平方差之比 即为： 



因此，相关系数或指数也等于0。类似的情况表明， 根本不 

存在相关。 

据此,相关系数可以取值从0到 + 1.0 或一 1.0, 相关指数可 
以取值从0到十1，0。当然，历史学家遇到的多数问题属于非完 
全相关的中间情况 P 这时，相关系数（指数）的绝对值越大，因 
变量与自变量之间的联系越紧密，给定自变量的影响程度和在结 
果变量变差中的比例 越大。 正如 a 指出的，相关系数平方一决 
定系数直接反映了受所分析的因素制约的变化比例或百分比 9 因 
此，当和哭系数（指数）的绝对恒大于0.7,而决定系数大于 
0.5(0, 71 2 = 0.5041 ) 时，就可以说变量之间的联系是紧密的， 
给定因素对结果变量变差的作用是决定性的 （ 因为它制约结果变 
量变化的50够以上）。因此，当相关系数和指数的绝对值从 0. T 到 
1_0时，可称之为离度相关。 

例如，在1 9设纪俄国贵族地产收入依賴其规模变化的史例 
中，相关系数等于0. 88 。因此，地产收入将近 H 铢（0. 882 )受_ 
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地产规模彤响。即是说，地产规模与地产收入的联系是紧密的， 
相关系数是高的，因素的作用是决定性的。 

相关系数和指数绝对值从 0.5 到0、7,可称之为中度相关。变 
量之间的联系也相应是中度的。因为在这神情况下，因翥在因变 
量变差中的比例少于一半，精确地说，^卩是从 
25务到4 ㈣ 。 

最后，相关系数和指数的绝对值从0到可称之为 低度相 
关， 因为这表明，给定因素在结果变量中的变差波动于0至25势 
之间，相 应变量 之间的 联系也相应是 弱的。由于具有髙度精确性 
的决定系数值表示出给定因素在因变量变差中的比例，因此，决 
定系数比相关系数更 有用处。 

如此看来，因变量与因素如果是直线依从关系，进行相失分 
析时就运用相关系数；如果是尚线关系时，就运用相关指数。偶 
相关系数能够测定相关的方向——正向或是负向，还能测定特征 
之间联系的紧密程度 I 而相关指数只能测定联系的»密程皮（因 
为它没有正负符号; U 相关系数的平方 （ 决定系数或指数 ） 能够表 
7$因素影梅程度以及给定因素在变量变差中的比例。因为相哭系 
数取 值从一 1到+ 1，所以，决定系数值就是0到1 a 

由于被分析的资料有各种各样的特征，为了节省精力和简化 
计算程序，计算相关系数有许多种不同的公式供选用。当资料较 
少时，用某种相应的公式，当资料较多时，则用另一种适宜的公 
式 I 当被研究的特征不多时，用第三种公式；而需要对资料进行 
分组时，坷能要选用第四种公式，如此等等。当然没有必要记住 
所有的公 式， 何是，计算每一类的资料应该如何选择和运用哪种 
专业 公式，是必须知道的，否则，在计算系数时就会枉费时[旬。 

计箅一般形式的相关系数，公式如下： 


8 ^ 



12 (x 一龙） iy-v) 

— ■■ 

nsxsy 

a 与^是自变景与因变量的个别值，5和？是其算术乎均数； 
^和 W 为^与^特征的标准误差 | W 为考察样本的数 g 
与>所有值的各个 O — Z ) (7—？）之乘^豪^号。我 Jp 举 
一个计算相关系数的例子。 f 

我们取一组值: 

tZ ^x I = i ? y j == 2 

办)欠2 = 2， y 2 ~ 4 

c }>%3 3 P J a = C 

并以下列形式计鋅相关系数： 


x y(x-^z ) ( x~ X) 2 ( y— ^ ) ( y—VY ( oc—x) (y~ S ) 
a 1 2 — l 1 —2 4 2 

6 2 4 0 0 0 0 0 

e 3 6 1 1 2 4 2 

~E§^~2 ~ ： ~2 — 4 ^ 

平均姐 ^ — ^ V 二 I 5 x = -|- s |=-|^ 

r + 4 + 4 +1 

r =- - = - —■ — = -j- 1 © 

( vlXvl ) 3- 

下面介绍一些以相关方法为基础的 逻辑 原則。 

当因变量变差取决于一个因素的部分越大，相应地 ， 因变量 
同这一因素之间的变化关系越一致，联系越紧密 ^ 当这一因素与 
其因变量值的波动绝对相同时，即波动迖到绝对一犁时，因变量 
变差就完全受这一因素制约。这时，相关系数和决定系数都等于1。 
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另一个极端是，因素与因变量的波 动完全不存在一致偉 。这 
吋，因变量变 差完全不爱给定因素制约， 所以相关系数和决定系 
数都等于0。当然，通常历史学家所遇到的情况，是处于这两个 
极端之间的中间状态 a _ 

由此舂来，运用相关方法是 依据评价因变鼉与_因*之间波 
动的一致性或协调性这一原则而 进行的€因 gl ， 称龙种方法为相 
关。很明相关系数高， 变童 之间的联系就紧密，相关系数 
低，联系 M 弱，如此等等。 

在很多情况下，研究若或是过于谨慎，或是忽视了相关系数 
和决定系数的实际意义，而把这两种指数； R 仅阐释 为变跫 之间波 
动一致和互相联系的指数。实际上， 一致‘性 只是评价结果变量侬 
赖 于给定因素的程度的方法和 手段， 或者说，是评 价因索 影晌因 

变遗的程度的手段。 

: H ； 实，一致性原则早已为历史学家 所熟知 。各种现象的变化在 
时间上相合，一向是分析这拽历史现象之间具有哪种依从哭系， 
以及评价一种现象是赍受另一种现象制约的 依据， 当然还有其他 
依据。例如，历史学家没有运用相关方法就査明，1807年 俄国加 
入大 陆封锁 ，①引起了粮食价格下降以及从英国进口的商品 
价格上涨。作出这一结论，首先是根据同英国断绝贸易往来与俄 
国粮食价格下降是 同时发生的。 同样，由于英国废除《粮食法 
令》⑧与〖 846 年俄国粮食进口增长的发生具有一 致性， 因此历史 


① 大恥^钺是拿破仑一世对英国实行的卩易封锁政策。1806如 S 07 年，章破命 
先后颁市 《 柏休法令米兰法令〜立恭封浈不列颠群岛， 弒止 大陆各国同 
英囯通前 & i 即7年俄国匕入大陆封锁，大陆封锁政策使英 国经济 迈受产适汀 
击， P 时也使包括哉国 V .-:内的、冏英囯有贸易戋系的大陆国家蒙受斤 K 现公 
— i , 「注 j 

② 1846年，英阴「5府度除 《 浪食法令■^使谷物关税降低 。此 W ,英面成力俄国 
农产品的虫要鹄笆市场：俄国.出口农产品的37%销注莱国译注 3 
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学家确认，两个事件之间具有因果联系。再举一个根据一致性原 
则得出研究结论的典型事例（这里指的是 1890 — 1 S 14 年俄国粮食 
价格波动的原因）:“尽管俄国与其他国家在粮食种植技能和生产 
率上有很大差別，尽管俄国在这25年内多次歉收祌或那 
种粮食种植多寡不一，但粮食价格曲线 ） 的>动 
仍 然十分 一致。 最后的结论是，俄国粮食克签银从于 
世界粮食价格％①这个结论是可信的，但是从可信的准确性来 
肴，结论还缺乏从量， L 评价世界价格对俄国价格的影响程度以及 
二者变化的一致程度，而要解决这个问题，只有借助于相关力法< 

运用相关分析，使我们重又遇到在进行回归分析时 Q 经遇到 
的情况。历史学家已经知道了，并正在自己的工作中运用着以相 
关方法为基础的逻辑原则，但是，他们没有使这些原则达到数学 
的精确性和明晰性，没有实现以这些逻辑原则为基础探讨类似相 
关系数这样的标准的可能性，借助相关系数可以对变量波动的一 
致性以及因素影响的程度作出数量估计。因为历史学不是精确科 
学，利用数学方法进行详尽分析不是历史学之所长，因而历史学 
家短于数学完全可以谅解。然而，既然在数学中具有以历史学家 
所知晓的逻辑原则为基础的研究方法，那么如果历史学家在研究 
屮拒绝应用这种十分有益而可以运用的相关方法，实在是不可 
原谅的疏忽。 

相关方法具有明晰性和准确性，同时还具有为历史学家熟知 
的以明晰性和准确性为基础的逻辑原则。这些特点，使相关方法 
无论在苏联还是在国外的历史学家中，都具有极大的影响。 

到现在为止，我们仅从最一般的分析上了解了相关分析。在 
解决原则上类似的各种历史问题时，相关分析的运用有很大区 


① U 914 年俄国与国外主要芾场商品价格汇编\波得格勒1916年，第 4—5 FU 












别，详细讨论这种 K 别是十分有益的。首光，对质的特征和置的 
特征所进行的相戈分析就不相同。 

我们还记得，在统计学中，将事物或现象的性质、特点或特 
殊性称作特征。例如，增长着的数置特征就是^ 些增 的数駐 
值，因此，这一增长着数量的各个値的在参定值的 
数量上，如 K5 ， 10. 5 等等 a 

而质的特征的各个个体的 E 别，不是在数量上，而是在质的 
内容上：例如，工人、农民、知识分子是“社会地位”这一质的 
特征的变化形式，而木 E 、 演员、会计等等是职业"这一质的 
特征的变化形式。 , 

在对质的特征与 fl 的特征进行分析时，怎样运用相关分析的 
专门方法，取决于资料的特点与性质 。让我 们首先了解在历史研 
究中如何运用相关方法分析最的特征 D 


历史学家运用相关方法的经验 

目前，苏联历史学家运用相关分析，旨在解决三组问题： 

1. 1 6 _ 2 0世纪价格史和 K 族农 业市场的发展; 2, 16_20 世纪农 
民经济和地主经济的 要素； 3 . U — 2 0 世纪农民的徭役以 及对农 
民的剥削程度。在国外历史编纂学中，正在对更为广泛的间题运 
用相关方法进行深入 研究， 我们仅列举 一二： 国会 选举、侨民、 
经济周期、收获量及其对人口发展的影响、价格史、都市化 ，等 
等。 


社会学家相当广泛地运 m 了相关分析的方法。实际上，他们 
正在用这种方法解决任何一个问题。这表明，历史学家可以比现 
在更广泛地运用相关分析，因为他们经常是从历史学角度来研究 
同样 的社会学问题。 
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下面让我们了解一下历史学家在对量的特征进行相关分析时 
取得的一些经验。我们从前面提到的16—別世纪俄国统一的农业 
市场的发展问题开始。研究贸易与价格史的历史学家们发 现了下 
而的规律：在 16— 17世纪自然经济时期，国内各地區地方市场的 
商品价格，无论就其水平，还是就其波动讲 r 差都很大 。例 
如，如果将俄国16世纪5个最重要的贸島咸（莫斯科/妄 :洛格 
达、霍尔莫格雷、诺夫哥罗德、沃洛科拉姆斯克）的粮食价格及 
其运动进行比较，就会发现其价格水平相差4 一 6倍，而且价格 
运动只呈现出微弱的一致性。 

、随着商品生产、劳动的社会分工与地理分工的发展，随着地 
方市场日益集中为全俄统一市场，各地区地方市场的价格水平越 
来越接近，价格的波动也越来越一致。到19世纪末至20世纪初， 
乌拉尔粮食的最低价格与北方的最高价格仅相差60铎，粮食价格 
运动的一致性甚高，不仅地方市场的年价格上，而且连月价格的 
变化也都是同步的 。 

历史学家发现了粮食价格运动的规律性，从而得出结 论：地 
区之间粮食价格水平的关系，尤其粮食价格运动的一 致程度 ，就 
是全俄 粮食市 场统一 程度的指教， 因此也是民族市场发展水平的 
指数。由此产生一个问题 ； 如何估计地方市场粮食价格运动一致 
性的程度？图象法和列表法都不能测定价格运动一致性的程度。 
但相关方法能够帮助历史学家。相关系数正是测定地方市场粮食 
价格运动一致性的理想手段。因为相芜系数可以取值从 -1 到+ 1, 
这个值域能够测定出，在全俄统一粮食市场形成的各个阶段中， 
地方市场统一的程度。这样，借助和关方法就可能对统一民族市 
场形成与发展的漫长进程进行数 量估计 。表8反映了相关分析时 
结果。 
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表 3 16— 20世纪欧俄地方市场粮食价格运动一致性动态 


乎均系数 


时 期 

相关系数： 

• 

_ ^- — —-=^r - .—^^4. 

預無定系数 

r 

16 世纪下半期 

0,36 

0.13 

17 世纪下半期 

0.55 

小于 0.3 

18 世纪上半期 

小于 0.7 

小于 0 * 5 

18 世纟 ilT 半期 

0.81 

0.66 

1 S 世纪上半期 

0,9 

0.8 

1 & 70 — i 913 年 

0.95 

0,9 


平均相关系数是地 方市场统一性或其融合为统一民族市场程 
度的指数。为找到这些指数需要计算出10万个相关系数。这些计 
算，10个研究者用尽毕生精力也未必能够完成，而用电子计算机 
却只需数小时。 

应该怎样解释计算结杲？ 

俄国粮食市场经历了漫长的发展过程。16世纪下半期，地方 
粮食市场之间的联系还很少，因此，一个市场对另一个市场粮食 
价格的依赖性也很小。在 P 世纪和18世纪上半期，地方市场之间 
的相互联系不断增长， 至1 3世纪50年代这种联系开始显著起来。 
但是，地方市场的价格运动仍只是在较小的程度上受俄罗斯其他 
地区价格运动的制约。18世纪下半期，在 H 54 年废除税卡①的一 
定影晌下，地方粮食价格运动的一致性开始变得比较高，欧俄任 


① 根据1753年12月法令，俄国取消国内税卡。 主要内容为 ，取消政府在各地区 
之间收取关税。根据 17 S 5 年颁布的税则规定，後国商人有权在国内进 行无親 
贸易；外国商人登记永远为俄国商人者，同俄国商人享有同等权利税则还 
.. 对农民、 贵族1 外国商人经商作了限制。甶于取消国内浼卡 * 促进了俄国备 
地区之间的商品经济联系——译注 • 
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何一个地方市场的价格变化大约 60 —70%受到其他地方市场价格 
的制约。 

此后，地方粮食价格的相互联系不断增长。19世纪年^. 
代在建立铁路支线网以后，地方粮食价格的波动⑽貧要 
他地区 价格波动的制约。由此可 以得出 结论，统一俄糇食市 
场形成于18 世纪下 半期，准确地说，是在50—60年代，这时，地 
方市场对俄国其他市场的粮食价格、对全俄价格构成条件的依 
赖，开始大于对地方条件的依赖 t 。 

但是，民族粮食市场没有停滞在18世纪下半期的水平上，由 
于各地 K 之问商品经济联系的增长，直到第一次世界大战以前， 

地方市场一体化的进程还在继续，全俄粮食市场在资本主义基础 
上的统一仍在加强。这样，止如 ■ 科瓦利琴科和 JT + B ■米洛 
夫在自己的研究中指出的，19世纪末形成了全俄农业市场一'所 
有农业商品和劳动力的统一民族市场。 

粮食价格动态的事例告诉我们，3需要估计这些或那挂现象 
变化的一致性，并以此为基础，作出关于这些现象之间的依从关 
系、相互影响、或一种现象对另一种现象影响程度的结论时，梠 
关分析可以极为精确和卓有成效地”工作'在这种情况下，对历 
史学家来说最重要的仍然是，首先要进行具体历史分析与逻辑分 
析，查明被研究现象之间联系存在的事实，然后，才能借助相关 
方法估计其间联系的程度。研究者应当时刻记住，为了解释作为 
a 索对结果变 a 影麻程 度指数 的相关系数，必须酋先进行质的、 

具体历史的分析，只有这种分析才能提供根据，以把一个变 M 视 
作因变量即结果，而把另一个变量视作因素即原因。相关分析本 
身并不能解决因果联系问题。它的作用就象磨*，只能出色地礙 
碎历史学家填上的谷物。 ^ 

苏联历史学家集中研究了革命以前俄国劳动人民的状况，特 
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别是在 191 7 年以前作为居民主体和国家主要生产力的农民的状 
况 t 在研究过程中 经常产 生两个问題：农民经济的繁荣依赖于哪 
些因素？它被地主和国家剥削的程度如何？为了解 g 这狴何 :®, 
近来历史学家开始运用相关分析，因为正是这种 | 析可 
较而查明影响农民经济状况的各种因素的作用。相■^接展系出 
什么样的研究可能性？让我们考察一些具体事例。 

历史学家已经熟知，影响农民经济状况的有如下因素土 
地占有和 t 地利用； 2. 牲畜, 3. 经济财产 | 令劳动力 | 5,赡 
养人口； I 6. 手工业活动； 7. 地祖和赋税。但是，将有关农民 
经济水乎和因素的材料进行 简单的比较， 不能解决每一个因素以 
及所有因素如何分别与共同影响农民经济繁荣的问题。表9妇纳 
反映了 19世纪特维尔省中等农户特征的材料。 

表9 19世纪持维尔省农户经济统计材料 


平均每个农户占有 


1 

18D 。 年 .182 。 ’ 十 :! 

1840 年 

IS60 年 

1 咖年 

1900 年 

牲畜（头） 

2.5 

2.3 

2.0 

1.9 

1.6 

15 

土地（侬亩/口） 

3-3 

3.0 

2.B 

2,S 

2. 0 

1.8 

劳动力 

4+2 

4. 1 

4.2 

4.0 

3-7 

3,2 

膽养人口 

2.3 

2,1 

2. 1 

2,0 

1.8 

2.0 

手工业收入（卢布） 

5.4 

S*5 

14-5 

⑵ 3 

ie.o 

13. 6 

收入 （卢布） 

23 28 

■i 

3T 

40 

55 

70 

地租和賦税（卢布） 

5*5 

: _ 

9.5 

15,5 


17.4 

20,5 


从表9看到，牲畜、土地和劳动力数量呈下降趋势，而手工 
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业收入呈增加趋势。同时，农户总收入和賦税都在增长 t 农户 ; 收 
入额的增长受到下列因素的制约 s 由于丰收和其他因素，农户劳 
动生产率提高；手工业收入增长；农业商品价格提高等等1却果。 
简单地将收入、赋役和反映农民经济的各基本因考迸态比 
较，那就不可能估计每个因桌对于农户 经济状 况所起的作用_，以/ 
及地租和賦税的增长在多大程度上依赖于农民祭济的现状和变 
化。对此，相关分析可以作出相当准确的回答（表10)。 

相关系数 （ 参见表10 ) 表明，_民经济水平同时依从于一组 


«10 19—20 世纪初俄 m 农民经济水平与决定水平的备因素 


之间的依从关系（相关系数) 


因 

索 


俄 

罗斯 

省份 



黑 

土地带 



非黑土地 

带 

19世纪 
上半期 

19世纪末 
—20 世纪初 

加世纪 | 
20年代 | 

1&世纪 
上半期 

19肽纪末 
_20世纪初 

20世纪 
20年代 

土地占有 

一 

0.60-0,70 

0.82 


一 

0.60-0.70 

0. 83 

播种面积 

0 . lb - 0 , 85 

0.80-0*90 

0,80 

0 

.80-0. B 5 

0,70-0,80 

0. S 5 

牲 

畜 

0.75-0. B 5 

0. 75- 0.85 

0.80 

0 

.75-0. 85 

0.70-0,80 

0.71 

劳动力 

0.85-0.90 

0,50-0*60 

0,81 

0 

-85-0.90 

0*40-0. 50 

D . S 1 

賦 

税 

0.75-0.90 


； 

0-75-0- 90 

-— 

一 
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因素，其中每一因素都杯重要的意义，所有的 因素瓦 相联系 ，这 
个结果完全合乎逻辑：如果农户缺乏任何一种生产要素，例如牲 
畜或土地，就不能正常生产。同时各个生产要素互制 
一定的播种迪积需要相应数量的劳力和生产工寧 

但与逻辑分析不同的是，相关分析可以确 kfefe - 民 _ 经 _ 济中各 
个因素的相对作用，并且彻底研究各个因素作用的读变，这对于 
历史学家特别重要9在将封建主义和资本主义时代农民经济水平 
与@素之间的相关系数进行比较之后发现，在封建时代，所有因 
素对于农民经济的作用几乎都一样 （ 劳动力的作用大一些）;在改 
革后的农村中，播种面积和牲畜数 a 对农户经济水平影响相对大 
一些，其次是土地占有，影响最小的是劳动力。 

上述结果说明了什么？影响农户经济的各个因素作用的变化 
与什么相联系？ 

与其他因素相比，农户中劳动力的年龄和人数的意义相对降 
低，这说明，在改革后的农村，农户自有劳动力的保障意义已退 
居次要地位：农户可能有许多劳动人手，但这已不能保证其经济 
的繁荣，因为经济的发展还需要货币、土地、牲畜和其他财产》 

19世纪下半期影响农民经济各个因素作用的变化说明,在农 
奴制时代的农村，由于村社根据农户劳动力数量平均分配土地， 
因此，农户在很大程度上自然地得到了土地保障，农户经济中劳 
动成员的构成在各种其他因素中就占有决定的地位。除此而外， 
农户拥有一定数量的土地保障还因为，地主不欢迎那种不能交纳 
全部賦税，反而要地主接济的破产农民。农奴制改革以后，农村 
状况根本改变了。村社制度以及与之相联系的土地重新分配与平 
均使用的制度被削弱，由于这一变化，农民之间的土地分配变得 
很不均衡，与此同时，由于农民普遍缺少土地，由 于非农 业收入 
增加,使农村与市场之间的联系加强，农民经济十分依赖城市收 









买商和市场，也即商业和工业资本。因此,农民经济水平开始不 
仅取决 T 所拥有的劳动人手，而且取决于所拥有的货币、财产，' 
以及财产所有者的经营素质和资本主义进取精神。 

表10概括了20世纪 2 0年代即集体化以前，苏联农彳_^|_户 
的各个因素的作用 数据。 这一时期，各个因素的作 k 同 wi & T 米 
2 0世纪初相比，发步了变化：它更接近于13世纪上半期的水平， 
即各个因素对农户经济水平的影响几乎并驾齐驱。这说明，在20 
世纪20年代，农民嶷济变得比 20— 30年以前更消费化和实物化 
这是因为，20年代土地按人0和劳动力分配，因此，农户的劳动 
成员以及与此相联系的播种面积对农民经济的繁荣又重新具有决 
定意义 & 上面的结论同在历史文献中査明的下述事实完全 相符： 
由于贯彻“上地法令"，俄国农业中资本主义_素的作用明显地被 
摧毁。在农村中进行这种革命改造，其结果/是使20年代小农也 
产成为半实物、半消费 的经济 & 

上述由回归分析朴充的关于农民封建赋税与经济状况之间依 
从关系的相关分析，提供了不少重要的结果（见表10)。情况表 
明，地租水平受到农户生产实力和财产状况紧密制约^我们通过 
静态 （ 确定的时刻）和动态 （ ！ 9 世纪上半期各个时期，各种规模 
的财产）考察得出农户地租、经济水平、收入之间的相关系数， 
是从+0,8到 + 0.1 这就表明^第一，赋税按照农户经济水平的 
提高和收入的 増设而 增加， 不是 下降， 因为如果下降，那么农户 
收入、经济水平与赋税之间的咲系应是逆向的，相关系数应是负 
号，即賦税增加，农户经济水平反而降低。第二，税收的变化幅 
度尽管与农户经济水平很一致，但不是绝对的，即是说，地租没 
有吞 噬农民的全部 收入， 还给他们留下了一些东西。 

爱 沙尼亚 历史学 家积极利用数学分析方法，在研究 17— 13 世 
纪地主和农民经济发展的过程中，取得十分重要和有趣的结果4 





借助于相关分析，他们 査明， 地主的播种面积与农民的播种面积 
之间，农民和地主播种面积的总和与农民的播种面积之间，都是 
正 向而 非逆向 联系。这种联系与 前访所 预测的||系& 
密的， m 相关系数表达分别为0_郎与 0.S4。 这姜碑 f 膝面 

枳的增长不是与农民播种面积的减少相联系，士楚与农民播种面 
积的增 加相伴 «的。其次，徭役的多少与农民的播种面积也有直 
接与紧密的联系一它们的相关系数等于0.81，这也证明了前面 
的观察：随着农户水平的提高，賦税是増加的。 ' 

上述相关分析使爱沙尼亚研究者对1 7—1 9世纪上半期爱沙尼 
亚经济得出第一个 结论： 在贵族经济与农民舒济的发展中，地主 
与农 K 之间 具苻物质利益关系， 超经济强制 已 与经济手段相结 
合。正是因为这种结合，保证了农奴制时代爱沙尼亚农业生产的 
不断增长。 

第二个结论是，封建地租以农民经济的发展为限，而不是多 
到导致农民经济下降的程度。当剥削强度高到排除 农民经 济正常 
发展任何可能性的时候，封連赋税对农户经济状况才发生决定影 
响。但是，在地租未造成这种危机作用以前，在绝大多数情况下， 
对于农民经济发展起主要作用的仍然是劳动力、牲畜、土地保障 
等其他因素 & 1 ' 

历史学家在相关一回归分析基础上得出的结论，使我们对下 
M 关于农民经济状况与地租关系的认识要作重要修正；在农奴制 
时代，地租总是影晌农民经济发展的决定因素，阻碍农户经济的 
增使农民力不胜任、经济破产。这种结论在爱沙尼亚将在什 
么程度上、什么范围内适用呢？回答这个问题，还有待于研究者 
的_7二作。 

棉出地 租与农户经济之间相互联系的研究结论，历史学家要 
花费很大精力，进行很多的计算^ 例如， 为査明19 世纪初 爱沙尼 




亚地租与农户经济 - 这 类的依从关系，需要分析 40 份地产中农民经 
济的12种因素、以及 U 2 价地产中的22种因素与地租的租巧系。 
用人工驾成计算显然需要大量时间，因而需 f 使甫^滅， ^用， 
计算机按照规成的专门程序完成计算既快又精确 

对賦役一税收与农艮经济中因素之间相互联系进行相关分 
析，在某些情况下，还可以回答课税原则的问题，如果它是未知 
的。研究14世纪拜占廷土地法律关系的研究者遇到了类似的问 i 
题。力查明课税规则，研究者计算了农户税 收与各种财产 、牲' 
畜、家庭成员数目、耕地规模、杲树数量等等之间的相关系数。 

在比较相关系数值的基础上，确定了所计算的各个课税对象重要 
性的次序。有关资料的相关分析表明，对税收影响幅度最大的是 
窣庭成员数和作为农户收入基本来源的那一种财产。由此得出结 
论： 在14世纪，拜占廷按人口一财产课税的原则占统治地位，这 
种原则表现出穸马晚期时代对依附民和非特权居民课税规则的特 
点 & 根据相关分析得出的结论，对在历史文献中形成的概念作了重 
要的、更为准确的说明^在14 此纪， 拜占廷并未保持按土地征税 
的罗马原则。① 

我们已经谈到，在国外的历史编赛学中，历史学家也正在广 
泛利用相关分析，并且十分成功。例如，运用相关分析査明了在 
镘饫的时期 （1753— 1913年）内瑞典的收获量同出生率、结婚 
率、死亡率、生育力之间的依从关系（表11)。 

相关分析便历史学家探寻出十分重要的规律性。在 U 世纪和 
19世纪40年代初以前，收获量对人 p 发展进程有明&的影响，因为 
在结婚率、生育力和出生率的变化中，收获量影响的比例为25— 
42铎。但是从 1 S 世纪中期歼始， 人口 发展过程从收获量波动的影 

① K ■ B * 赫沃 斯托娃拜占廷晚期（14_15世纪)土地法律关系的特点 h 奥斯 
科 W 68 年， 第 13SMc 


- B8 t 








: 表11 瑭典 1753— 1913 年牧获量对人口发展的影响 


年 代 


收获量指数之同的相关系数 

- 

\ 

^ U \ ) 

结婚率 

生育力 * 


死亡率 

175 3—1783 

0-61 

0.58 

0.55 

— 0.53 

1784—1807 

0.57 

0.57 

0.51 

— 0-12 

181 S — 1838 

0.64 

0. 62 

o-eo 

-0,09 

1839—1862 

0.25 

— 0.09 

*-0*08 

— 0. I 6 * 

1863—1892 

0.25 

— 0.25 

0.20 

-0.41 

1893—1913 

0.22 

— 0.02 

0.04 

0.02 


* 生 育力： 1000名育龄 （15 — 49岁）妇女的分娩数 0 


响下“解放”出来，开始取决于其他一些因素。这种变化的原因 
在于，第一，到19世纪中叶，瑞典农业达到这种发展 水平： 在很 
大程度上摆脱了气候条件的影响，并且开始不受气候波动的制约 
而对届民保证农产品供应。第二，工业革命引起居民大量流出农 
村，城市居民迅速.増长，众所周知，城市居民人口的发展对农业 
生产的依赖并不大。 

在任何研究中，历史学家总是与抽样资料而不是考察对象的 
总体打交道，指出这一点非常重要。历史学家在进行相关分析的 
基础上，得到抽样样本的相关系数或相关指数，得出关于依从关 
系性质、变量之间联系紧密程度以及给定因素在结果变量变差总 
和中的比例。在这种情况下将产生一个 问题; 如何估计抽样样本相 
关系数的可信程度？确定样本数超过30以上的样本 相关系轚标准 
误塞， 可按下列公式： 
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sr 
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SQ . Z 是 样本相关系数误差， r 为相关系数；#1为考察样本数。 

在农民地产收入值的例子中， 

的标准误差即是： 

1 -(0.88)^ I 
sr v x ^ Vio :: 一 

因此，19世纪末俄国贵族地产规模与收入总体的真实相关处 
于从0.88_0.08到0.88 + 0.08，即是从0,8到0，96的区间。 

应该指出，对于考察样本数在30以下的小样本，估计样本相 
关系数的可信程度最好不用这个公式，而用专门统计表和图象。 
顺便说明一下，统计表和图象方法也可以用来确定中等样木与大 
样本的相关系数的可倩程度。 , 

用相关指数剖析复杂联系 

以上考察的所有相失分析的实例，都属于因变量和自变量具 
有直线 联系， 即随着自变量的増加或减少，因变量也均衝地增加 
或减少这种情况。但是我们已经知道，变量也有处 于曲线依从关 
系的情况，即在变量变化的范围内，因变量值的变化是非直线型 
的（参见第 67— 69页） ：随着 因素值增加，结果变量非均衡地变 
化，有时增加有时减少。如果变量处于曲线依从关系，邨么可以 
用抛物线、双曲线冋归方程及其他曲线方程表示。在这 种情况 
下，如果使用相关系数，就低估了变量间联系的紧密程度。例 
如，当变量之间为曲线依从关系时，相关系数值也可能等于0, 
但是实际上，-这时变量之间却有紧密的联系。因此，当变量之间 
处于 曲线联 系时，就必须运用相 关指数 （ 也称作相关比）。这里有 
两个非常典型的例子。 

通过对爱沙尼亚1?一19世纪上半期地租水乎与农民经济状况 
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之间依从关系的分析，得出相关系数是一个不大的数宇0.36,而 
决定系数是 = 由此应该得出一个结论，农迫经济状况 

对整个地租水平的影响只占13钤，地租要是由地主贪欲恣 
肆程度所决定。但是，相关指数却是 O . S ^__ 决定_指数是夂由 
此又可以得出另外的结论：地租水平有 73 务受农民经济状况制 
约，换言之，农民经济状况是池主确定赋税数额的决定因素。 
由于地租与农民经济状况之间表现为曲线关系，相关系数对其间 
联系的紧密程度已不能作出恰当的评价。从地租与农民经济状况 
之间表现为非直线■性的关系，还可以得出另一个重要结论：在确 
定地租数额时，地主力图使农民感到自己的劳动有利可图，为 
此，地主必须与工具较齐备的殷实农户分享其经济劳动得到的最 
后一点辅助收入 ， 如果地主独吞这种收入，那么地租将按正比例 
增长，换言之，将随着农户财产的增长直线上升。 

第二个例子。研究的课 题是： GO 年代苏联工人的工龄、年 
龄、教育、提出的合理化建议数量、工资以及他们掌捱的相近专 
业的数量对劳动生产率产生什么影响。相关分析结果归纳为表 
12。 


表12 S 0 世纪60年代苏联工人劳动生产率与影响劳动生产 

率各因素之间的依从关系 


m 

素： 

相关系数 

相关指数 

X 

龄 

0. 250 

0-426 

年 

龄 

0.212 

0.415 

教 

育 

0*094 

0.107 

相近专数量 

0*176 

0,252 

合理化建议数 M 

0*1 J 9 

0.177 

工 

资 

0.451 

0.560 
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从表 12 看到， 6 个因素的相关指数都比相应的相关系数大 
0,5— 1倍^由此得出结论，劳动生产率与制约生芦率各因素 
之间的联系是非直线的，依从关系不是正比例的 p 

为了得到可信的相关指数，需要占有比求_正 确商] fe 关系数 
更多的材料。若将两者的计算相比，计算相关系数更简单，更迅 
速。 

这样,、与相关系数相类似，相关 指数也 是因变量明确变差与 
因变量变差总值之比，而决定指数一相关指数的平方（肀） 
—用来测定因变量由于因素作用而变化的比例，或者说因素对 
因变量彩1 •隹 度的比例。 

必须注意，在某些情况下，变量之间表现的不是因果关系，丨 
而是相互作用与相互影 tt 的关系。这时，由研究目的而定，一个 
变量既可以视作因变量，也可以视作自变量^例如，如果分析各种 
因素对劳动生产率的影响，那么教育、年龄、工资都成为自变量 
(因素）,而劳动生产率则成为因变量或结果变量。但是，如果研 
究者的任务是考察各种条件对工资的影响，那么此时工资则应被 
视作因变量，而劳动生产率则成为自变量。变量之间无论处于曲 
线联系还是直线联系时，都常有类似的情况。 餮如， 考察贵族地 
产规模对地产收入的影响时，地产规模就是自变量或因素，而收 
入额则是因变量或结果变童若研究者需要确定地产收入对地产 
规模的影响（这祥提问有助于研究一个很重要的 问题， 生产型和 
寄生型的地主怎祥花费地产收入或 剩余产 品？），那么，地产收入 
额就应被视作自变量，而地产规模则成为因变量。 

如果将变量更换位置，那么在变量之间处于直线联系时，相 
关系数值不变，在处于 曲线联 系时，相关指數将改变。例如在地 
租水平依赖于农民经济状况的事例中，当农户的经济实力作为自 
变量时，相关指数为0.86。而若分析地租数额对农户经济的影晡 
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时，郎取地租为因素，而把农户经济视作结果 变量， 細么相关指 
数就等于0.93。得到的结果意味着，地租与农$经济处于相互作 
用之中，-但是他们的作用不是绝对同义 efrlf 经济^对地租 
水平的影响小于地租对农户经济水平的影孩于历 i 学家来 
说，类似的结谂具有重要意义，因为它证明，在确定.地租数额 
时，农户绝不是被动地承受，而是积极地发挥作用，迫使地主考 
虑交纳地租的可能性。 

这样，在变量之间的依从芜系是直线形式的条件下，可以正 
确地估计因素对结果变量影响程度的是决定系数，而在依从关系 
是曲线形式的条件下，则是决定指数。 

还应该注意到一个很重要的情况，无论在测定直线联系还是 
非直线联系的紧密程度时，相关指数都同样适用。因此，当难以 
确定变量之间的依从关系形式时，可以首先算出相关指数。相关 
系数却没有这种适应性，因为运用相关系数要求具4两个条件 t 
变量之间具有直线联系，总体样本选择的随机性。而如果运用相 
关指数，除需要足够数量的考察样本之外，不要求具备其他条 
件。因此，相关指数是除去研究者意志以外联系的万 能指数 ，它 
能自动地适应变量之间任何形式的联系。尽管如此，运用相关指 
数却存在着夸大变量之间依从关系程度的危险，特别是在两种情 
况下 I 考察样本数量不足，未经回归方程计算即仅依据对材料进 
行分组就求出相关指数。抽样样本数目增加将会减少类似的危险 
性。 

在研究实践中，测定变董之间的联系常常从计算相关系数开 
始，以便大概地估计变量之间联系的程度，进而计算相关指数。 
在这里，首先要对两个指数 （ 即相关系数与相关指数^_一译注） 
进行比较，找出它们不同的原因，分析变量之间属于哪种联系形 
式，然辱选择相关系数抑或相关指数作为表示变量之间联系密切 


101 * 




程度和因素对因变量影晌程度的基本指数。 


在事物中间 



以上我们考察了两个变 M 的相关关系。但是，在研究复杂社 
会进程时，历史学家往往涉及这样的问题：为了解决问必须 
考虑同时起作用的一系列因素。 


在数学中有多元相关的分析方法，用来评价所有因素的集合 
对结果特征的共同影响。因素与因变量之间无论处于直线联系还 
是曲线联系，这种方法都可适用。但是，由于无论是建立曲线方 
裎还是阐释曲线依从关系的分析结果都比较困难，因此往 往允许 
对联系紧密性程度作不准确的评定，以便将变量的曲线关系转换 
为直线关系，换言之，要简化分析任务。这往往也能得到较好的 
结果 * 但如果这种简化过分，以致严重降低了分析的价值，那么 
就只得仍按变量之间为多元曲线依从关系的情况处理。 

下面，我们来考察历史学家在实践中常遇到的直线多元相关 
关系的事例。但所有事例都同样涉及到曲线多元相关。 

历史学家在研究有几个因素同一个结果变量或因变量的问题 
时》面临着两个任务：1,如何判断每个因素对因变量的“纯”影 
响； 如何判断各个因素共同或集合的作用，同时又不因同一个 
因素多次对因变量施加影响而夸大这种集合作用 & 

第一个任务可以借助纯相关系数或部分相关系数解决。这种 
系数能够确定，在排除了其余一切因素直接或间 接影响的条件 
下， 每个因 素对因变置的影响。 

第二个任务可以借助多元相关系敝解决在变量是曲线依从 
关系的情 况下， 指数被称为部分多 元相关指数或纯多元 相关指 
数。两个指数取值均为从0到+ I ^ 
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我们在考察多元回归和简单同归问题时，已经涉及到诸如儿 
个因素同一个结果变量这类问题。对^藉无论迸 _ 行相关分 
析还是回归分析，实质都是相阿的：$_^^集合”的 
两个方面研究变量之间的相互作用。两种分析务法的区别仅在 
于，多元回归是从结果变量依从于因素的变化程度这一角度研究 
变量之间的关系，而多元相关分析是从因素对因变量彩_ 的程度 
这一角度分析问题。 

在多元相关中，完全的 （ 一般又称之为零阶的）两两相关系 
数与纯相关系数不同。完全两两相关系数在考虑其他因素通过给 
定因素对因变量同时发生或间接发生影垧的基础上，测定结果变 
量与因素之间联系的紧密程度，而纯相关系数则排除其他因素对 
结果变量的这种影响。 

如果想估计俄 h 革命以前青年人的特征一教育、年龄、社 
会地位对其革命积极性的影响程度，那么，教育对革命积极性的 
直接影响和其他因素通过教育对这种积极性的间接影响，由革命 
积极性程度与教育水平之间的完全两两相关系数测定。而估计教 
育对革命积极性的纯影响，即排除了其他因素通过教育对革命积 
极性的间接影响，需要用纯相关系数测定。 

由 于所排除的因素数遣不同，因而纯相关系数划分为等级。 
第一、第二、第三级等各级纯相关系数各不相同。例如，只排除教 
育或年龄的間时作用，那么，社会出身与革命枳极性之间的相关 
系数，将是第一级纯相关 系数； 而如果既排除了教育，也排除了 
年龄的作用，将得到第二级纯相关系数，以此类推。 

纯相关系数与完全相关系数一样，可以取值从一1到+1。 
多元纯相关系数的计算冇两种 方法； 根据纯回归系数，或根据完 
全相关系数《例如，有两个因素同一个因变跫，那么在排除第二 
个因素作用的条 件下， 测定第一个因素的作用按 下列公 式计算 * 
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__ T i * 2 一 丨 1,3 厂 2*3 

r 1 "— (卜 c ^ 

r 为完全湘关 系數 ， U 2, 3 即在下 赛兔 與轵相臧 
系数反映哪个因素的影响 t 1 通常表示因 ii»h 2_厂 __ 3等表示因 
素 I ^ 2 . a 表示在排除第二个因素影响的条件下，第一个因素与 
因变量的纯相关系数> r 12434 即在排除第二三个等等因素影响的 
条件下，第一个因素与因变量的纯柑关系数。如果因素数量増 
加，计算程序的数 ft 将急剧增加。 

我们举一个纯相关的典型事例。研究16世纪农民历史的研究 
者们很早以前就试图解答这个问题，农奴有大量的自有份地，还 
是没有耕地，依靠从领主那里取得月粮为生。要研究16世纪俄国 
农民的农奴化过程，在很大程度上需要正确地解决这一问题。如 
果多数农奴耕种自己的土地，那么说明，第 一 ，已经产生了部分 
农奴与丧失了最后一点财产的农民的合流，因为按实际地位讲， 
自由农民与农奴是接近的；第二，在农奴制发展第一阶段的任何 
情况下，农奴制的农民技其出身讲，就是过去耕种土地的农奴。 
如果农奴整不多只耕种领主的土地，那么，类似上述的农奴与农 
民的合流就没有产生，因为，农奴只能从自由农民中得到补充。历 
史学家根据已经莩握的现有材料，测定了 1539—15扣年诺夫哥罗 
徳农奴、农民的数量与全部耕地数量之间的依从关系或失系的紧 
密程度。① 

完全两两相关系数是： 

农奴-耕地，- 0-81 

农民-耕地，- 0-82 

农奴-农民， r l 2 - — 0.90 

①£ . H ‘科酋切娃： 《 运用相关分析鲆决农奴史 中某些争论问題的尝 试〜較 
《苏联历史 >*19 矽年第 4 期，第 142 页„ 















. 正如我们所见到的，农奴数量与全部耕地规模之间有紧密的 
依从关系 （ r 13 = o .& i )。 这似乎说明，分农奴都有自己的份 
地，开且耕地数额的 66 铃 (0.81 X 0. 31 的数量。但 

是，自由农民数量与耕地规模之间同^表现_岀 _ 紧密的依从关系 
( r a3 = 0.82) & 由此产生一个问题，农奴数量与耕地规模之间的 
紧密依从关系是否反映第三个 H * 即自由农民数量的彩响？换言 
之，自由农民的数量是畨同时对农奴数量和耕地规模有重要的 
影响，或者说，后两者之间的紧密联系就是自由农民数量影响的 
结果？为了闽答这个问题，在估计农奴与耕地之间依从矢系程度 
的时候，必须排除第三个同时起作用的因素——自由农民数量的 
影响。农奴数量与耕地规模之间的纯相关系数是0.28。由此应当 
认为，农奴数量与耕地规模之间只有很微弱的依从关系，即农奴 
对 耕地数 额的作用小于8物 （ 0.28 X 0.2 B )， 农奴耕种的大部分土 
地屬于农奴主老爷，他们并没有与自由农民合流。 

纯相关系数只适用于对量的特征进行分析^除去本章下一部 
分所讲的情况而外，通常，纯相关系数不能用来计算质的特征。 

现在，让我们考察运用多元相关分析方法的实例。这是分析 
19 一 20世纪初俄国价格形成因素过程中的一个问题。 

对 1 S 01 — 1914年粮食价格的运动情况进行分析，查明影响仰 
格运动的是什么样的因素，以及这些因素单独与共同的作用如 
何，十分重要。解决这些任务，分为三个阶段。第一阶段，通过 
興体历史的分析，楕选那些已经或能够影响1 S 01 — 19 i 4 年粮食价 
格运动的因素。第二阶段，借助完全相关和纯相关两个系数，评 
价所考察的因素对粮食价格运动的作用程度。第三阶段，测定全 
部因素对粮食价格的共同影响，并且判断每个因素的&纯”作 

通过历史的、经济的分析，研究者挑选出12个因素。从理论. 
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上看， 这呰 因素能够影响 1 S 01— 1914年俄国粮食价格的运动： 
1. 居民总数, L 城市居民数* 3. 酿酒业市周转量* 
5. 粮食供 求哭系 | 6. 俄国卢布的货讳 ffj 情^ A 俄食出口 
额 j 8,税收； 9. 粮食出口价 > 10. 收获量_;^ _ 『. _ 地租；12 .粮 
食生产费用。 

依次分析每一因素影响粮食价格的程度，得出结论，理论上 
这 U 个因素对价格运动都有作用，而实际上作用明显的只有5个 
因 素： h 货币 总量； 2 . 货币行情； 3. 世界价格与出口 价格； 
4* 收获量 | 5. 粮食出口额。其余儿个因素对粮食价格的运动作 
用不大。要挑选起作用的因素，就必须通过具体历史分析和数学 
分析。起作用的因素具有这样的 条件： 第一，与粮食价格有真正 
的相互联系 （ 通过具体历史的分析证明 ）1 第二，相互联系紧密 
(通过相关分析，完全两两相哭系数证 明)。 可见，进行具体历史 
分析，能够确定对粮食价格有作甩的因素的 u 候选者 '而 迸行数 
学分析，则能提供这些因素影响价格的数量估计。最后，两种分 
析结合起来，便最终挑选出对 13 CH — 年粮食价格运动有作甩 

的因素。 

在求得完全相关系数基础上，可以对因素对于粮食价格的影 
响进行相关分析。在分析时，首先假设每一个因素孤立地、不依 
軟于其他因素而对价格起作用。当然在实际上，粮食价格的一切 
因素都是 S 相联系着的，即每一个因素既通过自身，同时也作为 
其他因素对价格作用的过渡坏节，影响着价格 & 因此，一个因索 
与价格之间的完金两两相关系数，反 映了价 格与这一个因素的联 
系，以及价格与同这一因素处于相互联系之中的那些因素的联 
系。这一因素对于粮食价格真正的“纯”意 义或； ^或小（同由52 
全相关系数表示的值相比），取决于其他因素间接4用的方向。如 
果其他因素间接影响的方向同被分析因素作用 的方向 一致，那 
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么，完全相关系数就夸大了后者的作用,如杲不一致，则低估:广 
者的作用。 

可见 * 仅借助完全相关系数，地 m 彼 k 之间有着 
依从关系的因素对粮食价格的影 响—虔 dr ? 至确地测定每个因 
索对 1 S 01 — 1^ 4 年粮食价格运动的作用，必须徘除其他因素通过 
给定因素对粮 I 价格的间接影响。正如我们已经知道的，纯相关 
数可以近似地测定因素的纯影响说它是近似而不是精确玢， 
是因为纯相关系数只能够排除那些参加分析的因素的影响，而不 
能排除未参加这一分析的因素的影响， 

在估计因素对粮食价格集合的或共同的影响时，同一个因 
素的影响不能考虑 两次： 首先考虑因素自身的影响，然后又考虑 
它通过其他因素的间接影响，为此必须恃别注意因素的纯影响。 

而 仅仅考虑因素“纯贡献”的多元相关系数，能够避免因素的 
“两面戏' 

对 U 0 i — l 9 l 4 年俄国粮食价 格运动 的因素进行相 关分析，結 
果如表13。 

*13 5个最重要因素对 i 30 l — 1 S 】4 年俄国粮食价格 


总体运动的影晌 


因 素 

相关系数 

决定系数 

完全 

纯 

完全 

纯 

货币总童 

0,70 

0* E 8 

U .49 

0.33 

货币行情 

0.47 

0.24 

0*22 

0.06 

粮食出口辆 

0.44 

1 0-33 

0.19 

0, 10 

收获置 〈粮 食） 

0.12 

— 0,31 

0.01 

0.09 

世界粮食价格 

1 

0.23 

0. 56 

Q .05 , 

0.31 


分析结杲证明，货币总童对粮食价格总体 运动的纯影响最 


m 























大，为 33 钩， 世界 粮食价仅逊于货币总-，为其杳$年^ 
因素——收获量、粮食出 a 额、货筇行情的纯影_和（ 

+ 6 =25钧）,还不如货币总量或世界粮食价格的&翁。1获量和 
世界价格的纯影响，比由完全相关系数表明的大几倍;其他因 
素，尤其是粮食出口额，削弱了它们对价格的影响。 

纯相关系数表明，收获量对价格的影响是逆向的，即纯相关 
系数是负号，价格与收获量表现出这样的相关情况：当收获量减 
少的时候，价格提高5相反，收成好的时候，价格则降低，并 
且，这种影响还相当大，达到9钧。世界价格的纯影响是31势， 
比完全相关系数所表明的影响大5倍。它正确地反映了世界粮食 
价格对俄国价格总体运动的真正 作用。 货币总量，货币行情、粮 
食出口额的纯影响，比它们的完全影响少1/3 — 2/3 fl 因为这些因 
素积蓄了 K 他因素对价格的作甩。例如，货币总量对粮食价格的 
影响，直接作用为67费 < 0.33:0.4&)，当它对其他因素起中介作 
用时，间接影响为 33 夯 （ （0. 49 — m ):0. 49 ) i 货币行情的影响， 

相应地为27 哚和粮食出 口额的影响，为 C 嗨和 5 3筘，等 
等 。 

估计收获量和世界价格对俄国粮食价格总体运动直接的与间 
接的影晌，是一个十分复杂的任务，因为其他因素不是加强了、 
而是削弱了它们的作用。显然，在这种情况下，世界粮食价格的 
直接影响是100势 （ 0.31:0.30,经过其他因素的间接影响是负 
S 4 场 （ （0. 3 1 — 0.0 5 ): O . S 1 ) ①，而收获量的影响，相应地为 
10 G 势和负90噁。 ， 

5个最重要的因素对俄国粮食价格总体运动的共同作用为 
74钩，因为多元相关系数为 G . 86，多元决定系数为 0_86 X (). S 6 = 


<& M 文有琪 * 应为 ((fl_OS_a31) :0.31) —译注 P 

.m * 







0. 7 也在因素分析中未考虑到的因素对粮食％格_变花 fj 制约\匕 
例为 26 弗(: ioa -74), 

对于货币总量、货币行情、粮食出口这三个因素来说，是第 
四级相关，即在排除其他4个因素对价格作用的条件下，纯相关 
系数绝对值比完全相关系数小；对于收获量和世界价格这两个因 
素，纯相关系数绝对值却比完全相关系数大。纯决足系数值总和 
‘（0, 叫 ） 比完全决定系数值总和（0. 96 ) 更接近于多元决定系数 
值 （0.74), 因此，每一个因素不仅自身对粮食价格布影响，而且 
也是其他因素影响的过波 环节。 但是，纯决定系数值总和毕苋超 
过了多 元决定系数值 0.15 (0.89 — 0.74)，因此，信助纯相关 
系数，甚至也不能完全摆脱其他因素同时发生的影响。为什么呢？ 

第一，纯决定系数测定给定因素对因变量影响的比例，仅是 
以消除 参加分 析因素发生的影响为前提 & 例如，在估计只有5个 
最重要的因素参加分析的事例中，实际上还有其他因素对粮食价 
格发生影响。 

第二，由于变量之间的联系过于 复杂， 变量的作用绽横交 
错，并且还有为研究者未知的因素，因此，挑选和测定各个因素 
的“纯”影响极为困难，并且在实践上完全行不通。这就导致当 
所有因素互相不依赖时，不可能建立计算多元相关系数和纯相关 
系数的理想模型。 

纯相关系数值并不绝对总是小于完全相关系数，发现这一点 
是重要的， S 为同时发生的影晌总是旣可能削弱、也可能加强给 
定因素的纯影响。譬如，在俄国价格运动因素的事例中，世界价 
格和收获量的纯影响，就比被同时起作用的那些因素弄“模糊” 
了的影响大。而收获量对粮食价格的影响，正象纯枏关系数所证 
明的，实际上不仅超过了由完全相关系数估计的作用，甚至出现 
了相反的情形；当收获量增长的时候，使得 价格降 低,、 而 不是象 
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从完全相关系数得出的结论那样，使价格提高。在速释情况下 ，\ } 
其他因素经过收获量对粮食价格的间接作用，不是;:模糊 
而是歪 S 了收获量对于价格的真正作用。 


19世纪70年代的_命者 
是些什么人 


历史学家常常要研究那些无法以数值计量的各种特征之间的 
关系。在这种情况下，就可 W 运用结合系数或联系系数（序 Q 表 
乐），以及限额系数或连 结桌数 （ 用伞 表示）来确定这些特征间的 
相 a 关系，上述这两种系数都是相关系数的一种变換形式'如果 
历史学家掌捤所研究的特征存在与否的材料，或是要研究两种性 
质对立的特征之间的相互关系，例如，是工人与不是工人、是革 
命者与不是革命者、丰收与歉收、冇学问与没有学问等等之间的相 


表 u 革命者开始革命活动前受教育的程度（咳0 


学校类别 

毕业 

学屯 

未能毕业者 

该类学生在学生 

总数中所占比例 

已结业 

未结业 

大 学 

45 

7 

4 

9 

中等学校 

18 

11 

4 

00 

其中： 





教会中学 

5 

2 

1 

18 

医务学校 




' 

师范学校 

6 

5 

0 

12 

古典中学 

7 

4 

3 

60 

其 他 

4 

5 

1 

1 

1 

总 计 

68 

53 

0 

100 


* 1 J 0 

* 
































互关系,.那么要评定这些性质特征间的联系就必须•运-用衆蓄系数 

匕 I 

或连结系数。 

让我们用19世纪70年代俄国革命运动问题~时_二呰^体历史事 
例来分析一下联系系数和连结系数的“作用”特点。 

从关于19世纪70年代俄国革命运动参加者的材料①来看（表 
14)， 2 /3的革命者垃各类大学和中学的学生，只有 I / 3 的人未在任 
何地方就读。但就是在那些未在校就读的人中大部分 （ 即32钩的 
未在校读书者中的23钤）都学习结业，其余的9 %都 上过学，但 
因备种原因辍学。 

上而引吊的材料使人感到，在校学习使得青年趋向革命。要 
检验这个假定正确与否，就必须借助联系系数和连结系数来估计 
在校学习同参加革命运动这两者间的相互联系的程度。为了计算 
这两个系数，我们制定出一个专门表格， 叫做四項轮流组合制 

表15 19世纪70年代萆命运动参加者与未参加者按 


在校读书与否的情况分类 （唤 >* 


读书与杏 

参加革命运动与否 

共 计 

已参加 

- 未参加 

在读书 

0.005 

0. 103 

0.108 

不在读书 

0.002 

99.890 

& 9. 892 

& 计 

0.007 

99.993 

100.0 


* 联系系数和连结系数可按绝对数据或按在考察的总数的基础上计算的百分比 


来计算 a 只有绝对数据是较大数目时才可用百分比表示。 


① A . A * 希洛夫 、 M . r . 卡尔帕乌霣尨编：《俄国革命运动的活动家传记 
辞典>，第2卷，第1一4分册,莫斯神1对2年 0 
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联系系数是 0.99， 连结系数是0.20。联系系数高说勝，•在校\ 
读书这一情况对青年人参加革命运动的确起很大 
数低又说明，在校学习绝不是便青年人参加革命运动_的唯 _：1 因 
素 & 学生中大约96%的人没有参加革命运动这一事实就说 明了这 
一点。将分析两种系数得到的结果联系起来就可以看出，革命者 
一般是学虫，但学生弁不一定是革命者。 

我们进一步发现（见表14)，革命者大部分都上过大学由此 
可以推断，比起在校学习这种一般情況，在大学学习是否才是更 
为本质的因素呢？我们再次借助联系系数和连结系数来检验一下 
这个假定正确与否（表16)。 

表世纪70年代大学生与非大学生参加 


革命运动的情况（场） 


是否大学朱 

参加苹命运动与杏 

共 n 

参 加 

1 

未参加 

大学生 

2.6 

6,2 


非大学生(其他学生） 

1*3 

89.9 

91.2 

总 计 

3*9 

90. 1 

! 100.0 


联系系数达 <3. 94,连结系数也相当可观 （0.43), 这就证实了 
我们的推测：在大学学习对青年趋向革命起着更大作用。然而连 
结系数也便我们有理由认为，在太学学习并非促使青年参加革命 
的决定 因素。 

分析关于19世纪川年代革命运动参加#社会地位的材料（表 
nh 就不能不注意到又一个十分重要的事实：将近40钩的参加者 
是贵族。那么我们可以运用联系系数和连结系数来判定 一 下，贵 

* h 

























*17 19 世纪 70 年 代依国 各类学生与革 

运动参加者的等 级构成(铎 

1 vk'li Xl)A\ k ： Piliir-"™" 


等 级 

学生 

类别 

参加革命 

运动情况 

屮学生 

大学生 

贵 族 

47 

57 

40 

僧 侣 

5 

15 

22 

城市％ 级 

34 

23 

29 

其中； 




商人，荣誉公民小 


9 

15 

市民， n 会手工业者 


14 

14 

农 民 

8 

3 

9 

外围人 

2 

2 


M 他 

4 

1 - 


总 计 

100 

100 

]00 


族出身与参加革命运动是否有关系？或者贵族出身是否促使了参 
加革命运动？为了回答上面的问题，将必要的材料编制成表18。 


裹 18 世纪 7 0年代革命运动中贵族出身与参加 

革命运动的关系 （夯） 


是否贵族 

是否参加革命运动 

共 计 

参 加 

未参加 

贵 族 

0,01 

■ . 

0.20 

0,21 

非贵族 

0.09 

39,70 

. 

99.79 


0.10 

59.90 

100.0 


联系系数高达0.94，说明贵族出身对这类人参加革命运动起 

• 113 - 

、 . 





















































着作用；然而连结系数之低 （0.04) 也表明，属 T 贵族等级这一 
点绝不是促使青年学生参加革命的决定的、也远不是唯一的因 
素，因为贵族出身的人大部分都未参加革命运动。而且众所 + 周 
知，在19世纪 7 0年代的俄国，教育在很太程度上是贵竭崖__特/ 
权。由此产生一个 问题： 贵族出身与参加革命运动之间的密 
系是否反映了有很多青年学生出身贵族这个事实呢？为解致这一 
问题，我们要考察关于学生的等级构成的材料 （ 见表17) & 

从表18的数据看，贵族出身的学生确实占多数。贵族出身与 
青年学生两者间的联系系数是 0 . 98 ,连结系数是 ( M 0 (见表19) & 


表13 W 坦纪70年代俄国学生的等级构成 （璐） 


是杏贵族 

学 生 

非学生 

共 计 

贵 族 

0.2 

1.0 

1*2 

非贵族 

0,2 

98.6 

98,8 

总 计 

0,4 

99,6 

100,0 


贵族出身与青年学生之间的密切关系证实了我们的假定 ，贵 
族出身与参加革命运动之间的关系反映学生中几乎有一半人是贵 
族出身。当然也应强调指出，贵族与非贵族出身的学生之间的连 
结系数很低，这表示贵族出身并非上学读书的唯一条件，其他种 
种因素也起着作用，比如财产、人事关系、个人素质1机会等 
等。 

这样，借助联系系数和连结系数，我们就能够判定，在19世 
纪70年代的俄国，教育、上学读书特别是在大学读书，对于形成 
革命情绪有看重大意义，而贵族出身对于贵族出身的学生的革命 
积极性形成并没有独立的意义。 

* iu - 

























观在我们来研究一下计算联系系数和连结系数的基本公式。 
为了计算系数，可以制定一个钼如下形式表示的因项轮流组合制 



上表中 为 所研究的甲、乙特征与非甲、非乙特征的 
频数； t ! + fr + c + d =-« 指考察的数目, 2是总和符号。 

联系系数的计算公式是= 

ad + cb 


连结系数的计算公 式是: 



ad cb 


(a + b)(c~i-d)(b + d)(Q + c) 


象相关系数一样，两种系数都取从一1到+1之间的值。如 
果系数的绝対值大于0 6,可以认为所研究的特钲之间存在重大联 


系。 


在活计某一些特征之间的相互关系时，连结系数的绝对值往 
往小于联系系数，这是由于连结系数评定相互关系往往比联系系 
数更深入细致。同时，联系系数越小，则它同连结系数的差别也 
越大。两种系数的不一致正说明它们具 有不同含义。 联系系数只 
从 一个方面来估计特征间的相互哭系 ； 某客体存在甲特征如何使 
它出现乙特征 （ 教育如何伲使革命情绪产生）。连结系数则同时从 
两个 方面来估计特征之间的相互.关系 t U 某客体存在乎特征如 
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何使它出现乙特征 》2. 某客体不存在甲特征（或存在与甲完全 
相反的特征）.如何使它也不存在乙特征 （ 或出现与乙相反的特 
征）。正因如此，连结系数的绝对值几乎总是比联系系数小1/2。： 
比如，在评定受教育对革命倾向的影响时，联系系数只阐令… 
问题：受教育如何使得革命倾向产生？而连绾系数则同'时解决¥ 
个问题：受教育如何使得革命倾向产生和没有受教育又如何影响 
到没有革命倾向？ 

两种系数含义上的区别也反映在名称上：联系系数是说明特 
征间 的筒单联系， 连结系数说明特征间的相互作用或 连结性 

由于联系系数和连结系数只是评定那些没有以完整准确的数 
量关系来表承其裎度变化的特征之间的联系，因而这两种系数并 
不能准确测量给 定因素对于结果特征的作用 大小，不能以准确数 
M 确定所研究的特征之间的相关程度。然而，借助联系系数和连结 
系数的确可以判定特征间相关程度的 有无和 大小。 比如，系数值 
0.8两倍于系数值0_4,并不能证明特征间的相关程度也大了一 
倍，但可以说，系数值是 0.8 的时候，比起系数值是 0.4 以及一般 
小于 CK 8 的时候，特征间的相关裎度是扩大了。 

与相羌系数不同，使甩联系系数和连结系数可以用符号表活 
相关的方向，即相关是正向还是逆向①，但便用符号要慎重。 

当特征的程度可以按某种标准粗略分为三组或更多几组的时 
候，历史学家可以使用相 S 连结系数 （用 C 表示）。例如，革命者 
可以分为这样 几组： 接受教育的程度，可分为文肓、受过初等教 
育、受过中等教育、受过髙等教育等组 f 按社会辿位，可分为特 
权阶层、非特权阶层、被剥削阶层等组；按参加革命运动的程 
度，可分为一般参加、被捕过一次，被捕过两次等组。我们用判 


①正向即芷相关，逆向为负相关，下同 译注， 
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定受教育的程 K 与参加革命运动的程度两者间依从关系这 t 例子 
来分析一下相互连结系数的用法（表20)。 



S 20 19世纪70年代参加革命运动的程度 

与 S 教育程度的依从关系 


\舞革命的 um 
受教育的枵 | 

•般参加 

被捕一次 

被捕馳 

共计 

- 1 

已毕业 ! 

93 

2 

3 

98 

在校学习 


6 

- 

81 

未受教竹 

32 

3 


41 


受敎育的程度与参加革命运动程度之间相互连结系数是 
0*256 ( 连结系数的值大致相同，由=0.20)，这说明特征间存在 
着相互依赖哭系，受教育程度对革命积极性大小有一定的作用。 

相互连结系数 （ 有时又叫皮尔松系数）的计算按照一个并不 
复杂的专门公式，全部必要的运算只需算术四则运算知识，： K : 计 
箅原理可在专门教科书屮找到。 

与联系系数和连结系数不同，相互连结系数总是正数，取 0 
到1 *0 之间的值^因此我们只能按原来表格中频数的排列次序确 
定相互联系的方向是正向还是逆向。比如在我们的例子中，如 
果受教育程度越高，革命枳极性也增校，那么两者的依从关系 
是正 向的 （ 假如革命积极性反而下降，那么依从关系就是逆向 
的)。 

相互连结系数的值同相关表中特征排列的次序，以及特征程 
度强弱的排列次序（弱，中等，强等等）都没有关系，仅仅取决 
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于相关表中特征的 麒截。 由于相互连结系数与特征 秦度排 刿次序 
无关，这就使它对测定那些不管程度强弱如 何效果 »— 样的性质 
特 征间的相关情况特别有效。因此，相互连结系数通常用于分析 
几个效果相同而不能分类排列的性质特征 （ 比如民族、_宗鞠 
业等等）之间的联系。 糧 

19世纪70年代宗教信仰，民族成分与参加革命活初乏 I 司的相 
互连结系数分别是 0.09 和 ( Ml , 这表明宗教信仰和民族成分对于 
青年的革命情绪的产生以及参加革命运动并未起什么实质性作 
用。 

当一种特征具有量的表现形式，另一种特征具有质的表现形 
式时，估计两者间的联系可以使用相互连接系数。然而，使用一 
种专门为类似情况制定的联系指数^更为合埋，它取值在 - 1 
到+1之间，既指出联系的方向，又指岀联系的紧密程度。联系 
指数的意义如同相关系数，我们也可以通过它来估计年於对参加 
革命运动 的影晌 （下面的数椐为百分 比）： 


年 龄 

参加者 

未参加者 

16—20 

37 

]3 

21—25 

45 

17 

26—30 

13 

17 

S 1 —35 

3 


36—40 

1 

11 

41—45 

1 

9 

46岁以上 

0 

2 L 


按上面数据计算，联系指数 h 的值为一0_55，它说明年龄对 
革命积极性的影响是 I 由于特征间联系呈逆向， b 带有负号，因 

,118 * 




















而越足年轻，革命枳极性越大。 


等级表 

历史学家常常碰到要估计各种现象、 

之问的相 K 关系.问题。这呰研究对象虽然无法 溯 定其徙确的数 
哭系，但可以根椐一种本质或性质在现象中设现的量的多少或强 
弱程度加以排列或调整。例如，可以 将人们 按文化水平、 m 力、 
地位等等来排列，可以将一些人或社会集团对各种事件、对另一 
些人或社会集团、对各种制度的态度按拥护服从或敌视反对的积 
度来排列。所有这些情况，尽管能大致判定研究对象某种本质的 
存在或强弱，但都要借劢斯皮尔门相关系数和肯德尔相关系数来 
测定研究对象的本质与特征之间的相互 x 系。 

斯皮尔门等级相关系数 （ 用^衷示）的计算公 式为： 

1 _ __ 6 

n(n 2 — 1 ) 

d 是等极差，即加以比较的特征序列中每一对的等级或序号 
数之间的差> «是特征序列屮耍相互比较的对数。 

等级系数取_1到+1之间的值，既指出相互联系的方向是 
正向还是逆向，又指出联系的紧密程度，我们已经通过联系指数 
G 评定过年龄对参加革命运动的影响 （ 参见第页上现在 
可以运用等级系数来评定年龄与参加革命运动之间的 &系程 度， 
或者说年龄对参加革命运动的影晌（表 U )。 

在上衷中，'我们将革命者分为 S 个年龄组，放在第1栏，并 
在第一松按顺序排出各组的序号。第 3 栏是各年龄组革命莕人数 
的数据。然后按各项数据的大小对年龄序列和参加者人数序列排 
出从第1到第 a 这8个等级。年龄序列的等级在第 4 栏，参加者 


特征与 
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人数序列的等级在第 5 栏。我们从结果特征的等级（第 5 栏参加 


表21 1 9世纪 7(5 年代革命运动参加者的竿蛉构成 


年 

龄組 

年龄 

参加 者数 M _ 

等级序号 


a * 

序 

号 

(% ) 

年龄参加者数吊: 

! 

\ ■ R 1 


1 

20 岁以下 

37.0 

"2 

21—25 岁 

45.2 ! 

3 

2 G — 30 

12*5 

4 

31—35 

2*8 

5 

36—40 

1-4 

6 

41—45 

1.0 

T 

46—50 

0*07 

8 

50岁以上 

0,03 


) 


8 

2 

6 

36 

T 

1 

— 6 

S 6 

6 

% 

一 3 

0 

5 

4 

一 1 

1 

4 

5 

+ 1 

1 

3 

6 

+ 3 

9 

2 

1 7 

+ 5 

25 

1 

1 a 

1 8 

+ 7 

49 


漭人数的等级）减去给定因素的等级（第 4 栏年龄的等级），将所 
得的差填 d 在第 6 栏，在第 7 栏填上差的平方以。按照公式，我 
们得出等级相关系数 的值： 


[7 



一 6 X 166 
Tx (64^ 0 


hp 9 8 = ~ * 0*98 


由于计算简单，等级系数一般由研究者自己就可计算。等级 
系数为一0.98，表明年龄的影响很大。 镡 等级系数呼联系指数 
( ri = - 0 , 55 ) 的意义有本质 区别， 这是因为， 虽 然两种系数都 
是运用佔计变量特征的协调性原则*但『〃能更精确、严密地估计年 
龄的作用，并且很 S 要的一点是，除了革命者的年龄外，还能估 
计到那些不参加革命运动者的年龄因素 （ 参见第11?页上文)。要 
研究某一现象，有关资料越多，推断其规律性就越淮确。 

通过联系系数显示了年龄与革命积极性之闻有十分密切的相 
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互哭系，这一点值得重视。它表明，在 ljgiazo 年$的俄国，先 
进思想的代表者正是年轻一代，正是_眺___人更本满于 
俄国的现存制度，渴望改变这种制度。之所以造^这一点，在相 
当大裎度上就因为年轻一代血气方刚，精力充沛，比老一代更少 
受到各种偏见、职业、社会关系等的束缚和影晌。 


*22 19世纪70年代革命运动参加者的社会等级出身 


社会等级 


参加者数量 

等级序号 


1 

分组序号 

社会等级 

(势） 

社会 

等级 

参加 

者 



1 

贵族 

30 

1 

1 

0 

0 

2 

僧侣 

22 

2 

2 

0 

0 

3 

荣誉公民 

0 

3*5 

4 

0 .S 

0*25 

4 

商人 

6 

3.5 

5 

1.5 

2,25 

5 \ 

军人（非贵族） 

5 

5 

6-5 

1.5 

2.25 

6 

小市民 

14 

6 

3 

一 3 

9 

7 

农民 

5 

7 

6.5 

— 0.5 

0.25 

总计 


100 



0 

U 


在有些情况下必须把几个组划为一个等级，比如在估计社会 
等级出身与革命积极性的相关情况的时候 （ 表 22), 就要把荣誉公 
民和商人这两种社会地位的人作为一十等级，因为在19世纪70年 
+代俄国的条件下，，他们有几乎相同的正式地位与此相同，也应 
把军人和农民眼革命积极性划为一个等级，因为这两类人参加革 
命运动的数量都是5唤。 

•# 

在这种情况下，最好按稍微复杂一点的公式计算等级相关系 
数，以便更准确地估计相关情况 & 将等级合并，修正后的等级相 
关系数等于0. 72 ,而未经修正时则为0_76。此种情况下得到的系 
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'数值差別弁不大，因为合并的只有两个等级。如:^级聆总数 
多，每一特征序列都几次合并3 — 4 差就 

会扩大， 修 正合并 后的笮级，则计算出的 k 数值就堡^。 

本来特征的程度或序列的数据不同，就分为多少组和多少等 
级，如 杲要将 程度或数据相同的几组划为同一等级，其等级序号 
取原有等级序号的算术平均数。比如我们的例子中荣誉公民同商 
人获得相同等级3-5，即 （ 3 十 O : 2 =3*5，军人和农民的革命 
积极性的等级是 6. 5, gp ( 6 + 7 ) ； 2 -6*5. 

骤然看来，社会地位与革命积极性之间相关系数越高，就说 
明人的地位越高，其革命倾向越大 & 但是如桌有另外一个因素通 
过社会地位间接地影响到革命积极性，那这个结论就可能是错误 
的。正如前面所说明的，教育就是这类因素。 

我们借助另一 个指数——肯德尔等级系数来判 定教育对革命 
积极性的作用。这种系数的计算公式是 r 

dL 


^ __ , _ 4 - A ^ 

Y 1 ) 

其中 心和1 是每一特征按程度划分的级别之和。其数值的女卜 
算如奉23 所示。 

将相应的值代入背德尔系数公式就得到 t 

n ，9 i 。 、 

这个系数说明，教育使得人们倾向革命，促使人们参加革命 
斗争。之所以这样是:因为，受教育有助于一个人更好地认清19世 
纪70年代俄国所处的形势，认识到当时俄国现存政治制度的落后 
性和反动性。受过教育的人对当时的先进的社会政治思想也有所 
了解，并渴望在俄围实现这些思想。 

至于社会出身一它与革命积极性的联系虽然较小也很密切 
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C 见表 22), 对于人的觉悟革命化并不起 拉4 施考的作用 。 社会地 
位与革命积极性之间的相互关系很 f 位高受敎 

育程度也高，从而对人的革命化所起_ 用迅: 


*23 革命运动参加者开始其革命活动前受教育的程度 


分组 


参加卷 * 

! 等级序号 

1 



序号 

受教甯程度 

数最（热) 

1受教育1参加者 

1程度数量 

J 

1 


1 

高等教育 

30 

1 

1 

6 

0 

2 

中等医务和师范教育 

0.030 

2 

3 

4 . 

1 

3 

中等技术教育 

0. 040 

3 

2 

4 i 

0 

4 

中等神职教 

0.015 

4 

4 

3 

0 

5 

普通中等教育 

0.007. 

5 

5 ! 

2 

0 

6 j 初等教育 

0*002 

6 


1 

0 

7 f 

1 

朱受教育 

0, 001 

7 

7 

0 

0 

总计 

J 



一 

— 

20 



* 指占该类学生总数的百分比。 


我们来研究一下肯德尔等级系数的计算方法 （ 见表23)。表中 
前面几栏填写同表 22 的类似栏目一样，均按计算斯皮尔门系数的. 
原则，但最后两栏填写则不同。第6栏第一排的数目是表示第5 
栏中结果特征的等级有多少组，这些组的等级序号按绝对值而言 
( 而不是在实质上）都大于笫一组的等级序号。在受教育程度方 
面，與有高等教育程度的一组抜参加革命的人数而言是第1等级 
( 见第5栏），而 以下的所有 6个组的等级按绝对值而言都比第 
—组大，即第 3， 第 2 等等。因而，按绝对值而茛比第一组等级 
大的有 6 个组。这个数 H 6 就填在第 6 栏的第一排^第二排的数 
目填 4， 因为第二组以下的各组按绝对值而言等级更大的有 4 
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个，就是第4，第5,第6和第7等等。第6栏悱总足填 
0，因为已经是最后一组，没有与之比较禅^弟 I ,填舲数0 
用 h 表-示，其总数是20。 

第7栏备排数目表示第5栏中相应组以下的从属特征等级有 
多少组，这些组的等级序号按绝对值而言都小于该相应组的等级 
序号。第7栏第一排是0,是因为第5栏中第一组以下的各组等 
级没有一个是小于 W 第二排是1 ,是因为第二组以下各组中仅 
有一组，即第三组的等级小于它 & 第三排是0,是因为以下各组 
的等级都大于第三组，如此等等。第7栏的数目用表汞，其总 
和是1。 

了解斯皮尔门等级系数 （P ) 和肯德尔等级系数 （ r ) 后就发 
觉，它们各有优点^斯皮尔门系数的主要优点是计算简单、 I 快 
捷。然而，肯德尔系数尽管在计算上比斯皮尔门系数更费事，却有 
一系列特有的投处。由于肯德尔系数评价相关情况更加细微，因此 
它的数值总较小（如我们例子中的 0.91 和 0.97); 为认清它的数学 
含义，制订了一些专门 标准； 只要在系数家族中增加一个新成 
员，它也很容易换算。 

斯皮尔门系数最太优点是能用于分析纯相关 ，即指这种惜 
况：当几个因素都在起作用，而研究者却要抛开其他因素的作 
用，单纯弄清一个因素的作用。 

比如，革命积极性与受教育之间的肯德尔系数是= 0.91， 
革命积极性与年龄之间是 q 3 = 0.89,受教育与年龄之间是 = 
1.00。受教育与革命积极性之间的纯斯皮尔门系数，按公式计坏 
结果是： ^ 



V(I— r aa ) 
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„0.9 t —0- S 9 X 1 \ 

—(r-o789 r >tr-~i) 一 \ 

i ， 一 -- 一 

同样在年龄与革命积极性之间 U 纯皮^系数计算结杲 


也是0。逵里的原因在于，在70年代，年龄与上学读书之间是完 
全相关，这种相关反映一个规律：在当时的俄国上学读书时主要 
是青年。我们还可以用下面的解释来说明所得到的系数。在我们 
所研究的时期中，革命积极性在根本上同时取决于两个紧密相关 
的 因素： 一个是受教育，一个是年龄。任何单独的、脱离另外一 
个因素的因素都没有重要意义。要成为革命者，仅仅是青年或仅 
仅是学生都不/行，必须同时是青年和学生。这反映了一个事实： 
19世纪 70 年代站在革命斗争前列的是青年学生，主要是大学生。 

通过分析两种系数的优点，可以得出如下结论：肯德尔系数 
适合于对相互联系作深入细致的分析，而斯皮尔门系数则适合于 


快捷大致的估价相关情况。 


上述例子表明，要运用等级相关系数就必须对研究对象进行 
等级估价。这项工作如何进行呢？首先，要对每个研究对象按所 
研究的特征的程度窩低定上若干级，并要将已分级的特征按级别 
升降次序排列。然后，对以上述方式整理好的每个研究对象按级 
别的相同性质分成若干组，每一组的顺序号就是诙组的等级，等 
级数目决定于分组的数量。如果分成 U 组，那就分成11个等级， 
如杲分15组，就是15个等级，如此等等。特征程度最髙的一组是第 
1等级，程度最低的一组则是最大等级，中间的各组的等级从第 
2 —直到指等级的总数）。 

例如 ，'対 1905年革命中欧俄部分的50个省可以按革命运动在 
各省的规模来分类整理。我们依据的不是楮确的统计，而是当时 
人大致的评价，以及各省长、警察局长等的报告。然后按革命运动 
规摸大小将这些省分成若干组 （ 5组、10组等等），给每个组划一 
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个等级，这样50个省就被排成5个1 10个 或更臺 j 也等级。 

我们还可以用其他方法进行分类整理 3 | 前面就是 
釆用如下方法。首先是按特征的程度将刘\象划分-若手£ _ ，并给各 
组定上等级。然后就直接使研究对象按组排列，无需对每个对象 
划分一次级别。比如 ， i 9世纪70年代的任何一个革命者总属于某 
个阶层，总处于某个正式地位或具有某种影响。我们就依擗正式的 
社会地位排列得出结果。将所有革命者分为若干按“社会影响”划 
分的组以后，我们就得到一个革命者按社会地位排列的系列。我们 
还可以用同样方法按革命者的受教育程度、年龄等进行分类排列。 

数学分析方法能深入了解19世纪 


70 年代的俄国革命运动 


为了分析19世纪70年代俄国革命运动的各种因素,我们运用 
了数学统计中几乎全部现有的方法来评价备个质的特征之间的相 
关情况 < 表24)，这就可以得出下面的结论。 


表24 19世纪70年代在俄国影响革命积极性的因素 


特 征 


系 



数 


联系 
系数 

Q 

连结1相互连结 
系，， c 数 

联系 
指数 

Tb 

斯皮尔门 
系 数 

P 

肯德尔 
系数 

Z 

社会地位 

0.&5 

' 一 

0.04 

— 


0, 72 


受教育裎度 

0. 99 

0.20 

0.97 


0. 96 

0.91 

年 龄 

-0,99 

0.43 

0, 98 

— 0-55 

一 0.38 

一 0.89 

宗教信仰 



0.03 




民族成分 


一 

0.11 


— 



注：除了相互连结系数总是正数外，所有系数都有正号或负号0 










































教育和年龄对革命情绪形成起着决定性影 k - sB 岁 H 下的青 
年学生，主要是大学 张， 站在同专制制度斗争的前列；而宗教信 
仰、民族成分和社会地位等对青年的革命积极性则不起任何重要 
作用。 

上述特点使革命运动的社会基础极其广泛，并为反专制制度 
的斗争转入第三个阶段——无产阶级革命斗争的阶段打下了基 
础。正因如此，列宁在评价 is 世纪70年代的革命者时写道，战士 
的圈子扩大了，他们同人民的联系密切起来了 

19世纪70年代俄 S 革命运动的统计学规律使研究者能进行深 
入的異体历史分析，通过分析正好解释为什么青年大学生起来造 
反，为什 么是教 育和年龄而不是社会出身、宗教信仰和民族成分 
对革命积极性形成起着决定作用， 

必须注意到，我们运用了不同的系数来评价同样因素的作 
nu 取得结果有时相同，冇时不同（见表20。之所以要运用不同 
的联系系数，在我们的情况下有两个理由，一是看材料自身的特 
点，二是出于分析的逻辑性要求。分析某些特征的联系就只能运 
用一种系数。比如分析宗教信仰和民族成分的影响就只能运用柑 
互连结系数，因为这些特征的作用每一个都差不多；而分析其他 
因素时，开始是运用最简单的方法，即运用无徭花费很多时间的 
联系系数和连结系数。只有在此以后，即通过联系系数和连结系 
数判定了各个因素的作用以;5,才运用更复杂的系数。因此，研 
究者的处理一般总足：首先进行快捷大略的估汁，然后才转入周 
密深入的分析。往往粗略的估计能够取得同更精密炱杂的联系系 
数一样的结果。比如，估计教育对革命积极性的作用， 最简单 的 
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联系系数 同更 加复杂的等级系数得到的结论大致然是 j 
有个一 «性規刻： 越简单的系数，评定相关情况 越粗^■相 ■反厂 
系数越精密， 测定相关情况就越细微、 准确* 

最后要指出，由于质的特征在程度上没有明确的量的次序， 

因而各种联系系数并不能对这些特征之间的相关情况作出准确的 
数量评价。因此，在解释运用这些系数所得到的结果时，第一要 
十分慎重，第二要稍微区别于相关系数的解释。 

这样，我们对运用相关方法分析备种质的特征有了一个了 
解，这些特征或是完全无法作出数量统计，或是只能祖略测定其 
程度的大、中、小、髙低、强弱等等。我们所援引的例子已肯定 
地表明，所有质的特征，无论性质相同和相反，还是按次序排 
列，都能够从相关联系的角度予以分析。通过试验得出的这一结. 
论，推翻了这类研究者所持的论据，他们认为，既然历史学家渉 
及的主要是那些无法加以准确计量的质的特征，那么在历史研究 
中数学方法似乎意义十分有限0 

对质的特征进行相关分析还为历史学家解决了一个重要问 
题。历史学家，特别是研究16—18世纪时期的历史学家，常常不 
得不使 用准确性不* 的统计材料，根据这种材料要么只能讲特征 
程度较大或较小，要么只能按特征程度的髙低来排列数据。对于 
这类近似的数据，研究者可以运用对质的特征进行相关分析的方 
法，这一方法给那些只因材料不是髙度准确而没能运用数学方法 
的历史学家带来了巨大的希望* 


回归系数与相关系数的适用范围 

在前面几章里讲到有许多不同的数学系数，这便缺乏数学泾 
验的历史学家不能明确地确定它们的涵义、意义和运用方法。因 
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此宥必要考察在历史研究中应如何运 m 回归分耀析问 _i 

题* 

实际上，回归分析与相关分析的全部内容用三个指数就可以 
表示： M 归系数； 2 . 依 S 变量而变化的因变量估计标准误 
差 I 3 .决定（相关）系数。 , 

回归系数 表示因变跫或结果变量依自变霉或因素变化的比 
率。例如，回归系数指出了贵族地产的规模每变化1个单位，地 
产的收入如何变化 r 在收获置每变化一个单位时，粮食价袼如何变 
化 J 在份地每变化一个单位时，农民的赋役如何变化，等等。例 
如，地产收入与地产规模 的回® 系数等于 0.006G6 千卢布，这就意 
味着，地产规模每增加1俄亩，地产收入将増加 100606 千卢布 
或 6 _ 06 卢布 a 

依自变量变化的因变贵 估计标准误差 或预言误差，表示可以 
在何种准确的程度上根据因素来确定结果变量，換言之，它表活 
所编制的回归方程可以达到何种满意程度 a 例如，根据地产规模 
估计的地产收入的估计标准误荖为 ± 0.0994 千卢布，送就衷明， 
在根据地产规模确定地产收入的时候，估计值的平均误差将等于 
0 . 09&4 千卢布。我们注意到，顸测的平均误差等于地产全部实际 
收入的 13 吻左右。根据这一点可以认为，回归方程编制得相当 
好，历史学家发现了影晌地产收入的极为重要的因素。 

通常，研究者总是力求揭示和确定制约着研究对象的所有最 
重要因素所起的作用，然后将这些因素按其各自不同地位排列， 

编制成一 f 回归方程 u 评价方程的编制和对每个因素作用的确定 
正确与否， 4 亦即评价是否正确地解决了所有的任务，只有唯一一 
种方法：将用回归方程计算的因变量值与因变量实际值进行比 
I 预测错误越小，说明研究者提出任务越恰当，解决任务越圆 
满。 因此， 由自变量估计因变量的估计标准误差，可以作为检验 
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研究苒解决所提出任务达到何种正 磯程度 的标准 。_ 

决定系败 足相关系数的平方，用来测定在因变 変化 中宥多 


大部分受因素制约^例如，地产收入与地产规模之间的决定系数用 
0 . 876 2 = 0.77 表示，这就是说，地产收入的变化中约有 77 哚取决 


于地产的规模。 


回归系数和依据自变量预测的因变量的标准误羞都是 名数厂 
即它们具有因变量或自变量因素所使用的名称单位。比如，地产 
规模每玫变1俄亩，用千卢布表示的地产收入因变量则增加 
0.00606，即 0.00606 千卢布^对依地产规模而变化的地产收入进 
行预测 * 其估计标准误差为 0.0994 千卢布。决定系数和栢关系数 
都是非 名数。 

回归系数与标准误差可以取在何绝对值，而决定系数与相关 
系数只能取值从0到1。 

回归系数与相关系数都有符号，或正或负，当有两个系数 
时，这些符号相同。符号表示变量之间联系的方向一正向或者 
逆向决定系数总是正数，因为正、负相关系数的平方都是正数， 
根据自变量预测的因变量估计标准误差同时具有两个符号一正 
号与负号，这意味着，因变量的实际值可能大于也可能小于用邴 
归方程依据自变量预测的数值， 

以上指 出的三个指数——回归系数、估计标准误差与决定系 
数互有 区别。 它们可以 从不同 方面分别测定因变量与自变量的相 
互关系。 

回归系 数评定 依自变变化的因变量的绝对变化，因此评定 
的是变量 之间数 S 关系的实质， 也就是说，回归系数是从因变琴 
依据自变量的变化中产生出来的。这是变量关系的第一个方面。 

决定系数评定自变 量对因 变量彩 S 的程度， 这种影 响的比 
例，以及两种变量变化一致性的程度。这是变量之间关系的第二 
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估计标准误差评定根据自变量估计的因变量的精 确运度 ，也 
就是评定预测的因变量的精确程度或回归方程的正确 程度。 这是 
对研究者完成的工 : 作迸行评价的标准。 

这三个指数在研究工作中都有十分重要的作用。然而，其中 
嘛 j 个更需要引起历史学家的特别注意呢？这取决于在正在进行 
的研究阶段中什么数值最有意义：如杲是因变量变化的绝对值， 
那么注意力应当集中在回归系数上 i 如果是评价预测的因变量的 
精确程度，那么估计标准误蒞则有特殊重要的作用> 如果是因素 
影响的程度或变量之间联系紧密性的 稈度， 那么最重要的是决定 
系数。 可见，这三个指数在研究过程中都占屯自己特定的地位 I 
其中任何一个指数都不应抛弃9 

因为回归系数与相关系数分别描述同一个变量礁定的相互关 
系中不同的确定方面，因此，一个系数可以以根据另—个系数求 
到， 如果已知相关系数 （ 0,那么可以按下列公式计算间归系数 
(10, 而无须再解方程组 t 



为因变量标准误差， L 为自变量标准误差。 

在贵族他产的例子中，地产规摸与地产收入的相关系数等于 
-0.876, 变量标4误差分别为〜=私 14 , ^ = 59.70, 由吵求得 

回归系数为* =0.876，^^=0.00606。 

词样，如果已知回归系数，也可以按下列公式求得相关系数 I 


^ ff • X 



仔细观察这两个公式不难发现，相关系数实质上就是回归系 



敖， K 是它不用测定变 ffl 的单 位衷 示，而是用变量的極推误萆之 
比来表示。因此，可以将相关系数看作不 奋析齡 变量的 契化 
度影响的回归系数，也就是对变量的变化正 的-商 归系 

w ■ 

数。 

同样，如果回归系数值不受变 ffl 测置 单位的制约，那么它就 
可以成为变 S 之间相关联系程度的指数 ； 在自变量变化时，因变 
蛍变化 越大，那么它们之间的联系越紧密。 

在历史研究中，同对与某种条件变化相联系的某个指数的预 
测问题相比，关于各个因素的影响程度和作用的问题更经常出 
现。 因邱，对于历史学家来说，相关系数的作用比回归系数的作 
用更为重要。 

回归系数不能测量因素对结果变量的影响程度，因为回归系 
数的绝对值由变量变化度所决定。但是，某些历史学家却忘记了 
这一点，试图根据回归系数值判定各个因素的作用。他们以为， 
回归系数越大，与这个系数相对应的因素的作用也越大。甚至^ 
连用诸如指数、等级等抽象的数字取代具体、实际的变量值，根 
据 回归系数判定因素的作用，也是不正确的 a 因为指数、等级等 
抽象数字排除的不是变量变化度，而只是測定变最的 单位。 既然 
由指数表芾的变量标准误差依然如旧，那么这种做法并不能令人 
满意。 

回归系数对变量变化度的依赖，使得回归系数与相关系数在 
变量的变化中远不总是精确地互相联系。因此，髙相关系数并不 
总是与髙回归系数相对应，或者相反。让我们来考察具体的事例。 

表25包括了 1801 —1914年期间俄国粮食价格与粮食价格因素 
之间的回归系数与相关系数。 

将相关系数和回归系数按绝对值大小排列，比较表^中相哭 
系数（第 2 栏）的次序系列和回归系数的次序系列（第 4 栏），没 
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有发现 其间存绝对的联系。 经我们 观察， 回@系敷最大值 P 应的 
是倒数第2 的相哭 系数，诺如此类，等 等。; 第> 个因 
素的两个系数的级别相同。以斯皮尔门等级相-关-系薇为中介，估 
计表25中两组系数值一致性的程度等于0.62。由此可以得出结 
论，表中任何一个系数的变异只受到另一个系数全部变化38势 
(0.62 2 )的制约。因此，一个系数值并不能预先被另一个系数值 


所决定 


表25 1 B 01— 191 4 年粮食价格与价格因索的联系 


因 素 

相关系数 

等级 

K 归系数 

等级 

货币总量 

0.7 D 

] 

0,2842 

2 

铖市居民百分比 

0.63 

2 

0.0895 

3 

赋 税 

0,54 

3 

0,0354 

6 

居民总数 

0,49 

■ 

4 

0.0854 

5 

货币行情 

0.47 

5 

0.0865 

4 

粮食出口 

0.42 

6 

0.0044 

10 

酿酒此 

-0.27 

7 

— 0,0341 

7 

粮食出 n 价格 

0.21 

& 

0.0106 

8 

粮食需求与供给关系 

0-06 

9 

0.3110 

1 

收获量 

— 0.01 

10 

— 0.0087 

9 


,由此可见，回归系数与相关系数几乎概括了全部回归一相关 
分析的结果，因为这些系数说明了变量变化的类型（正向的或逆 
向的）、肜式（直线的或曲线的）、联系的紧密程度与数量关系，同 
时检验了分析的结杲。 

对 变量进行分析所要求的具体任务，促使研究者挑选这种或 
那种形式的回归系数或相关系数以及其计算方法。当所分析的两 
个变量表现为直线联系时，选用相关系数与回归系数；表现为双 
曲线联系时，选用相关指数与某些回归系数。在进行直线多元相 
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哭分析时，使用的指数有多元相关系数、两两相关系数■和纯关 
系数，在进行曲线多元相吏分析时， ffi 多为数^两碑>关 
指数、两两回归系数和纯固归系数以及纯 tfaa 数狀發栩兵系数 
进行 计算。 

相关系数具有极为灵活的适应性。在数学统计学中，为了计 
算取决于资料的性质和所分析的变量之间的联系形式的相关系 
* 数，需要深入研究十几个公式。在表 26 中，归纳出了最重要的不 
苘形式的相关指数以及运用这些指数的基本条件。 


表扣 各种相关指数及其运用的基本条件 


相关指数 

运 用的基本条件 

指数值 

联系系数 ( Q ) 

连结系数(办> 

2 个线型联系的特征 

具备 1 个，连结表阶数为 2 X 2 

从一 1， 到+ 1 

皮尔松相互连结系 
数⑹ 

2 个质的 或遗 的特征，每一 
特征有儿种（不小于 3 ) 不同意 
义的变化彤式 * 每一种变化形 
式频数不小于 5; 直线联系. 

从0到1 

联系指数 

1个量的特征与1卞质的特 
征：直线联系。 

从一 1 到+ 1 

斯皮尔门相关系数 
( P ) 与肯德尔相关 
系数 ( r ) 

按次序 击卩列的质的特征； 直 
浅联系， ^ 

从一 1到1 

相关系数(『） 

直线联系；样本数目大宁12: 
特征接近于常态分布. 

从 一 1到+ 1 

相关指数幼） 

大样木 （100 以上），直线与曲 
线联系 . 

从0到1 
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变量之间的相关指数虽然有各种各样的形式， 但^ ^们都有 
共 N ® 结构一逻辑基碥^或者以相互连基础* ^者以 
协调性原则为基础。相互连结原则的实 ••如 i 在重 
复出现的一种类型的许多现象中，某 一种# 征与另 t 种特征在大 
多数情况下不是由于偶然情势的集合而同时出现，那么这些特征 
之间就存在着联系。例如，对⑺世纪 7 0年代革命运动的全部分 
析，就是为了寻找和评价表现该运动参加者的相互连接的特征9 
分析结果表明，年轻与受到教育通常是参加革命运动者互相联结 
的特征6 

按照相互连结原则而发生影响的系数，是相关系数中的一组 
系数，它 们是： 联系系数、连结系数与相互连结系数。它们的名 
称反映了它们的工作原则。这些工作原则注定了它们只为砰价质 
的特征之间的联系而用。 

第二组指数是等级相关系数与相关系数，以及相关_数。深 
入研究这些指数，旨在测定数量特征之间的联系以及按次序排列 
的质的特征之间的联系。这些指数根据协俱 性或一 致性原则起作 
用。在这种情况下，判定变董乏间是否具有联系的根据是，变量 
值的变化姑否同时发生，即当自变置变 化时， 因变*是否随之发 
生稳定的变化（増加或减少）。 

每一种联系指数都适用于测定一 定形式 的根关 * 其运用都受 
到一系列因素（参见表26 ) 的限制以及相关分析 目的的 制约。 

在确定运用嫌一种联系指数能够解决具体任务的时候,通常 
要考虑一系列因素1 1. 资料数量 I 2. 资料的性质 | 质的或量的 
特征； 3. 变量之间的依从形式 I 直线的或非直线的> 4. 所要求 
的钎算精确度，_如杲不要求高度精确，可以用能够迅速算出结果 
的等级相关系数代替相关系数> 5,计算方法适宜，计算技术程 
序难易适宜> 6. 能否进行解释 * 7. 利用这种或那种相关指数& 


J 时_ 





普遍性 （ 以便有可能对各种结果 进行比 较)。 __ 

以上的分析已经使读者确信，运用囬闷和桓关方法对^析 
最为丰富多样的特征以及特征之间的结合。这种务析_助可信 
程度将 取决于4 个因素 ，1， 问题的提法以及！在计# _ ；£前所进行 
的质的、 具体 历史的分析是否正确 I 2. 资料的数量，因为通常 
只有 当具备 大量考察样本的时候 * 才能得到稳妥可信 的结论 I 
3,成功池选取相宜的系数>是否正确地解释了所得到的系 

m . 


ft 杂的依从关系 


预先对被研究变量之间的关系进行内容丰，窗、具体历史的分 
析，无论在相关分析中还是在回归分析中，都具有特别重要的意 
%。 因为变量的变化具有稳定的一致性并因此有 髙相关 系 :数本 
身，并不能成为断定变量之间具有因果舉系的充足根据 & 肴本去 
相互联系的两个变暈，除去其中每一个都单 独与蕹 3个值发生关 
系这种况外，事实上并不一定有重要的，联系 * 这就象岳母是女 
婿的奉<必须有她与玄壻妻子的，牵属关系作中介 一样。 类似这 
样的依从关系，即两个变量是第三个原因_结杲，我 ip 在分析革 
命运动参加者与其社会出身之间的联系时已经遇到过。革命积极 

画- ■ 、 ■ 

性与贵族出身之间有紧密的联系，实际上并不是反映出身的影 
响，而是教育的影响，因为受教育'是贵族的特探。因此，教育就 
是与貴族地位紧密相连而影响革命积极性的那第三个 肉素一 

■ j ■ 

，路之， 变量之间紧密相关，可以推测它们之 间有因 果的相 a 

■ I 、 ■ ■ ■ ■ 

联幂 ，但当两个变量是第三个原因的结果时，可以指 出它; 们之间也 
存在着这种联系7只有对变量之.间的关系进行具体历史和与逻辑 
的分析，才能查明它们之间存在着的因果联系，并且选出一个变 
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電作为因变量或结果变量，而另一 个变景 作为自变量或 因素。 

有时，由于变量值價然的巧合，也能发现变鼉之调紧寧相 
关。这种情况可以说是无 意义的相关。 1沢|^%年间基联电话 

1 1, L- A/, n Lrs 1^, M 

机数量与医院病床数量之间的联系，就是类^似 贫两箱 k 的 事例。 

电话机的数量与病床的数量之间表现出高度相关——相关系 
数等于0.95。电话交谈注定要引起病人和病床数僵的增 J 卩或减 
少，这种说法只能作为笑谈。在这里，相关已失去意义。可是， 
在确认这稗相关无意义之前，还必须查明，电话交谈与病床数量 
之间的联系是否由于另一个间接的作 ffl . 在起作用。例如，+可以假 
设还存 在第三个原因 ^— 技术的进步。它一方面促进了电话机数 
量 的增加，另一方面更充分地满足了对病床的需求但是， 甚至 
连这样的阐释也完全没有 意义* 很显然，病床的数量不可能⑽铎 
( 0,95 2 )被电话机的数量所制约，这个相关应该被认为是偶然 
的，因为 两个现 f 之间的联系实际上并不存在。 

不仅在时间& 畴可以观察到无意义相关， 而且 在空间序列也 
可以观察到 无意义相关。世纪 7 0~80年代 锻国几 个省份的粮食 
价格 与居民数量增长之间被观察到有十分紧密的直接联系，就是 
这种无意义相关的事例。如果现象之间虽然相关却互相没有联 
系，那么说明，两个现象空间变化的一致只不过是偶然的。 

由此可见，如果具体历史逻辑的分析没有发现两个观 象之间 
有直接的因果联系，那么,这两个现象之间的相哭联系就不是它 
们之间具存因果关系的依据，而只能说明，它们经过一个第三€ 
素建 立了相 互关系，因而存在着同这个第因素的联系。 

相 关帮助 W 史学家找判原因 

但是， 历史学家为了 査明哮 研究曳麗之间的因果关系，利片 J 

* 術 P * 








相关方法是适宜的。在分析时间序列而涉及到这种关系的时候， 
历史学家运用相关分析的可能尤其大。这里有一个典型的例子 * 
将俄国1801—1914年粮食价格与用于每个人的货币周转童动 
态进行比较,它们之间高度的一致性引人注目^ 



1801— 

1811 — 

1821 — 

1831 — 

1841 — 

1851— 


1810年 

mo 年 

mo 年 

1840年 

18 50年 

1860^_, 

I 

662 

529 

407 

412 

417^ 

'""676 

I 

43 

38 

30 

41 

39 

50 


1861 — 

1871— 

1881 — 

1891 — 

1901 — 



1870年 

1880年 

1890年 

1900年 

19U 年 


I 

813 

828 

715 

662 

826 


1 

50 

57 

50 

48 

"59 



附注： I ——以每普特金戈比讨俄罗斯中部粮食价格 | 〜 

I ——以毎个居民金戈比计货疖置。 t . 

■ ■ ■ ■ 

■ ■ ■ • • _ • % 

^海10年间 （ 除 U41 — 18&0 年外）货币量的增减与粮食价格的 
涨落都相一致 • 签半比 较粮食价格与货币量的波动也证明，_它们 
有很髙的协调性，因为相关系数等于0:70。因 此-庸 置疑，价格; 
与货币童动态有紧密的联系 • 但是，两者中嘛个矣原@，哪个是 
结果呢？ 

为了解决上面提出的问题，必须首先注意到， W 世纪俄国货 
币市场上并未感觉货币不足。纸币的、而从 1M0 年是信贷货币的 
变化的行情，影响到货币总量极度动荡：纸币行情涨落某 个百分 

比,导致以黄金表现的货币量的实际价 值也璩 少或增加。因此， 

■ . ■ ■ . •- • 

• ■ 







在货币价格上升时期，对货币量的需求就大，而对货币需求的增 
加能够引起纸币和钞票行情上涨；相反，在价格跌落时期，由于 
对货疖需求减少，纸币行情下跌。随着货币行情的涨落，同一种 
货币量的实际值就上升或下降，这样就容易保持住商品和 货币量 


的均衡，分析上述情况可以作出结论, 
中，货币总量是被动的因 yL 



悒是不能忘记，纸芾行惜 （ 货币总 M 实的 it 要原 
因）处于对外贸易，包括粮食出口、俄国贸易和国际收支平衡、 
卢布行情的影响之下，对外贸易的影响程度比俄国价格的影响 
更大。在这种情况下，纸币行情和与此相联系的货币量值同俄国 
价格相比，就成为积极的因素。用思辩甚而借助描述粮食价格和 
货币量运动的表格和图象的方法来解决上述的 问题： 什么依从于 
什么一一价格依从于货币量还是货币 H 依从于价格，都显得太复 
杂。在这甩，运用相关分析恰恰十分有益。 

下面借助相关分析估计货币量与粮食价格波动之间的相关系 
数：第一步，逐年将同一年的价格与货币量进行比较；第二步， 
移动一年的货币——酋先取当年的价格、上一年的货币量，然后 
取当年的价格、后一年的货 HIM ， 分别进行比较。如果价格是原 
因，那么价格与货币量的紧密联系就表现在，货币量向后移动一 
年应当减少，而向前移动一年应当増加。因为原因先于结果。相 
反， 如果货币是原因，那么紧密联系则表现为，货币向后移动一 
年应该增加，向前移动一年应当减少。 

分析货币量与粮食价格之间的联系证明，货币量的变化先于 
粮食价格的变化，因为如果给定年份货币量与后一年价格相关， 
价格与货币 S 之间联系的紧密度是从 0.74 增加到 0 . 90 ; 如果给定 
年份价格与后一年货币量相关，两者之间联系的紧密度是从 0.90 
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减少到 O . h 。 1 ® i ■ 

、这 样，相关方法能够便我们査明，两个互相联岽的现燊中哪 
^个先起作用。在此基础上研究者可以得出绪论，哪一个现象是 
源因，哪一个观象是结果。似是，一个规象 跟蝻另 一个现象是作 
为什么是联系的原因的一个特征，而不是唯=的時征。因此0 
得出什么是原因和结果的结论之前，需要仔细地^分析爾间的 
相互关系。如杲在作出什么是联系的原因的结论袁稱分析娜^ 
个现象在另一个观象之前的一神知识还不能解決商题財,运用枏 
关分析也许是非常有益的 i : 

回归分析与相关分折是研究者手中得力的研氈工其。回归分 
析能够预测和再现所缺乏的史料，掲示虏免现象变化的时间规 
律,同时估计一个现象在另>个现象变化尚 条件下 变化的程度。 
换亩之，借助回归分析，研竞者能够以一舨的形式反映出现象与 
因素之间数量关系的性质 a 相关分析能够輞定各个因素的影响以 
及估计它们対被研究齟象的综合作用 」 ： i M 

我们不应该忘 te , 数学分析只是为历史学家所利用的 工具， 
能否成功地运用数学方法，首先取决于历虫学家在多大程度上了 
解与所提出问题有关的因素,取决于他在多大程度上进行了 k 
的、具体历史的分析，换言之，取决于餅茺者在多大程度1是一 
个好的历史学家，其次才是数学方面的知识。_ 


①但是必须强货帀章不能自动影响所有的价帑，:包括粮食价格。贵金厲价 
值’所发生的影响， 归也结 麁是采金矿亚与所有国民经济部门中劳动生产牢对 
比变化的影咱。 


* 
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第五章是原因，还是偶然性? 


1( 历史研究中的方差分 




19世纪中期地主在哪里生活有利可图? 


研究愀国贵族状况的历史学家，在档案中顺利地找到关于 19 
世纪 50 年代分布于国内各省的太 M 地主地产收入的资料。为了估 
计地主地产所处的地晖位置:对其迪产收入额的影响@度，，历:史学 
家将所掌握的关于地主收入的材料苢先按省份进行+分组，然后 
又分为黑土与非黑土两个大的地区（表27 > 

^ .赛? 7 的材料表明，非黑土地区各省塊主地产 取入 达黑； t 独区 
各 省地主收入高 0.8 卢布，或者髙6哜 3 由此可以得出结论，地主 
的收入，及与此有关杯彳对农奴农民的剥削程度，在^定程度上取决 
于地产的地理位置，并且啡黑土地带各省较髙，但是严格说来， 
作出这个结论为时尚早，因为并未考虑到，各省、各地区地产平 
均收入的差异可能是偶然性的结果*第一/研究者对非黑土地 K 
9个省和黑土地区 U 个省①发现的材料数童不同；第二，所抽选 
的地产对于本地区来讲可能并不 S 典型的 

看来，借助相关分析不可 能解决 上述关于地产地理位 置影响 
地产收入的问题。因为被分析因素 一 地产的地理 位董具 有数暈 

• X" • 

①原文有误，应力黑土地区9个省，非黑土地 [Kli 个 f —— 译注 P 
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表现形式不占主导地位的质的特征。 

在 1 类似这样的情况下，当研究者面对的任务是估计质 珅持征 

对 数量特 征的作用时，可以运用方差分析。 


*27 19世纪50年代地主年收入(每个男性人口银卢布) 


黑土省份 

收入 

非黑土省份 

入 

图拉省 

15 

彼得堡省 


梁赞省 

10 

诺夫苺罗徳省 

13 

奥尔洛夫斯克省 

13 

普斯科夫省 

17' 

唐波夫省 

12 

斯庠棱斯克省 

16 

库尔斯克省 

13 

莫斯科省 

12 

沃龙涅什省 

■ 

14 

弗拉基米尔省 

14 

喀山省 

17 

下诺夫哥罗德省 

13 

平扎省 

13 

利斯待罗马苗 

12 

辛比尔斯克省 

16 

雅罗斯拉夫省 

14 



特维尔省 

15 



卡卢加镥 

16 

平 均 

13.7 


14.5 


方差分析要凹答刚才的 问题： 居住在各个地区的地主收入之 
所以产生差异，究竟是由于地产地理位置的影响，还是偶然的， 
因样本含有误羞所致。在这个具体的情况下，方差分析要对各个 
地区之间的地主收入波动与地区内部的地主收入波动进行比较。 
而在一般情况下，方差分析则是要将 各组之 间的因变量波动与各 
组内部的因变量波动进行比较 & 通常，由于历史学家分析的总是 
紳样资料，因而也可以说，比较样本之间的因变量波动与样本内 
部的因变量波动，就是方差分析的基础^ 

如果地区（组）内部的地主收入 （ 因变量）波动 S 度小于地 
区(组)之间的地主收入波动，研究者就有权得出 结论： 地产的地 
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理位置（自变童、因素） 对地主收入的数额有影晌。相反，地产 
地理位置 （ 因素） 的影响应该被否定。 

可见，方差分析的实质在于对各组之间的因变量波动以及各 
组内部的因变量波动进行比较,.方差分析的 a 辑也于此可见。地 
区之间的地主收入波动受地区的制约，精确地说，是受这个或那 
个地区的地产地理位置的制约，而地区 内部的 地主收入波受未 
考察的其他原因的制约，即除去地产地理$置素制 kj 。 
如果地产地理位置 （ 被考虑因素）的影响4重要 _ &,那么它对居 
住在不同地区的地主收入波动的影响应该大子对居住在[司一个地 
区的地主收入波动的影响。这时，地区之间的地主收入波动应该 
超过地区内部的地主收入波动。相反，如果地产地理位置的影响 
不存在，或者这种影响很弱，那么地区之间的收入波动应该是不 
茧 耍的，而处于未考虑因素影响下的、地区内部的地主收入波动 
应该是重要的，超过地区之间的地主收入波动。 

对历史学家来说， 方差分析的逻辑 中没有什么新的东西 ，因 
为他总是在有意识地或是凭着直觉循着这种逻辑来构思自 己的结 
论。在所研究过的事例中，历史学家试图估计地产地理位置对地 
主收入的影响，因而，他将各份地产按地区分组，然后估价地区 
之间的地主平均收入差有多大。如果平均收入的差别大，可以 
说，地产地理位置对地主收入的影响是强的，如果不大，则应该 
说影响是弱的。因为按地区考察的地主平均收入，取决于地区内 
部的各份地产收入的波动，而地区之间的平均收入差异程度，取 
决于地区之间的收入波动，所以，历史学家在估价地产的地理位 
置对地产收入的影响时，无论愿意与否都要通过这种方法：将池 
区内部的收入波动与地区之间的收入波动进行比较。闬数学语言 
来说，尽管历史学家进行的分析不完全合乎规范，但"确实是方差 
分析. 
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对历史学家来说，在数学意义的方整分析中的新东西在 T , 
估价按地区平均收入荽别和估价地区内部与地区之间的收入波 
动，不是'靠眼睛和直觉，而是依据精确的数学标准。因此， 用这 
种方法得到的结论更加可信和有充分根据/而研究者主观意志的 
影响已被缩减到最低的限度， _ 

由此看来，方差分析就象 闾归分 析和相关分挺一碑 r 能够^\ 
括非数学学者的研究实践，弁给这种研究实践找数_ 根据。 
下面，我们来考察如何进行方差分析* 

正如我们了解到的，方差 （p ) 是变量波助或变差的数额， 
也即是变量各个值偏离其算术平均值乘方的算术平均值：… 

?2 一1^ 一# 

o —• — - - ■ ■〜 , 

n 

这里 M 趙变量的个别值是变量的平均算术值1«是考察样本数。 

因此，在进行地产地理位置对地产收入影响的方差分析时， 

翌将地区内部的收入方差同地 S 之间的收入方差进行比较。而在 
一般形式下，方差分析则是将在各组范围内的因变董方差（组内 
方差）同各组之间的给定因变量方差 （ 组间方差）进行比较。 

只有当地区内部的地主收入方差与地 K 之间的地主收入方差 
之差超过偶然性允许的范围时，才有理由断定，地产的地理位置 
对地产的收入有影响。这个结论的一般形式表述 如下： 当组内方 
基与组间方差的差别超过偶然性允许的范围时，那么,！被考虑的 
因素就对因变:鼠有重要的影峋；相反，如果这种差别处于偶然性 
允许的范围之内，那么，关于因素影响的假定就被否定。 

表28包括了对俄国 U 世纪50年代地主收入受池理位置影响的 
方差分析。 

地区内部与地区之间地主收入方差之差没有超过偶然性即样 
本错误的范围 f 方差实际比等于^40,方差的最大理论比（由专 
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表 28 俄国 19 世纪 so 年代地主收入受地埋 

影响的方差分析 


收入变差 

偏珩 

平方和 

, 

f H i 由®数门 

方 ■& 

戊) 

L 组问方差与组内 


00 


理论的 

地区之间 

~ ' 

3-20 

2—1=1 

3.20 

1,40 

24 T 

地区内部 

80. 76 

20— 2 ==18 

4.49 

参考基数 

总收入变差（所 
有材料之间） 

83.96 

20—1 -19 





门统计表确定）等于247。由此，完全有数学根据地得出结论：按 
地区观察的收入变差是偶然的，.，它并不受地产地理位置的制约。 

十分重要的是，方差分析可以大概估计出考察因素与未考察 
因素的彩嘀程度。这种估汁需要分别计算出组内因变量偏离乘方 
和以及组间因变 M 偏离乘方和在偏离乘方总和中的比例，因为偏 
离乘方总和屉山组内偏离平方和与组间偏离平方和相加而得到 
的。在地±收入的例子中，池区之间收入偏离平方和的比例足 
4%，而地区内部对收入偏离平方总和的比例是％吻 （ 参见表28第 
2栏）。这 W 个数值为作出下面的结论提供了根据：地产之间的收 
入波动，大约4够取决于地理位置，96螞取决于其他的因素 & 

在进行方差分析估计因素趿响的时候^表现出与相关分析明 
显的相似之处 & 实际上，借劢相关分析佔计被考虑因素与未被考 
虑因素的影响，是按照这些原则进行的：因变量明确变差（〜，） 
与因变量总变差0，）之比得出決定 系数； 

y 

决定系数表明，被考察的因素在因变量变差中细比例。其余的或 
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不明确的因变量变差 d 2 ) 对因变量总变差之 



测定被考 


虑的因素在因变量变差中的比例。估计未被考虑因素在因变量变 
差中的比例还可以用其他方式一^确定该未考虑因素与被考虑因 
素比例之间的差数。在进行方差分析时就.是用这种方式* 

组间偏离乘方和相当于因变量的明确变差部分，因为它表承 
出被考虑因素—地产的地理位置对因变童的影响1而组内偏离 
平方和相当于不明确的或剩余的收入变差，因为它表宗出未考虑 
因索的影晌 I 而偏离乘方总和描述出因变量的总变差。组间变 
差，即因变量明确变差对总变差之比表示出被考虑因素影晌的 
比例；而组内变差，卽剩余变差对总变差之比，表示出未考虑因 
素对因变量变差的影响比例。由此可见，无论方差分析迅是相关分 
析，都有闻一 个数学琢則和目的： 测定变量之间依存的程度和联 
系的紧密程度。它们之7间的区别仅在于运 用范围 不同：相关分析 
被用来估计以数量形式表现的因素的影响,而方差分析是在估计 
具存质的表现形式的因素时使用。 

以按省分组的各份地产收入的具体材料为基础，借助方差分 
析也可以确定地产的地理位置对收入的影响，在这种情况下，应 
该估计的不是地区对收入的通响，而是省份对收入的影响^组内 
方差表征出各省内地产之间地主收入的变差，而组间方差表征出 
各省之间的收入的变差。 

估计一个因素影响，估计一个因素统计综合的方差分析，其 
计算不需要很多时间，因此在绝大多数情况下，进行这样的计算 
不必用大型电子计算机，而用手工操作键盘的计算机即可。因此， 
我们可以详细研究方差分析的计算技术，进而熟悉它以便更好地 
理解方差分析的实质。估计地产的地理位置对地主收入的影响， 
有固定的计算序列（表 29 









表 29 俄国19世纪50年代地产地理位置对地主收入值给 响评估 

指 i | 黑土地区 < a ) | 非黑七地 _ 全 ^ 


分析第一阶段 ； 确定各组平均值与组间总平均值 


按省平均地产收入值， 

15* 10, 13, 

12, 18, 17, 16, 


每个男性人口银卢 

12, 13, 14, 

12> 14, 13, 12, 


才I了 . - 

17, 1J, 16 

1 

U， 15, 16 

—- 

收人和(X] x ) . 

^ 15 + 10 

P - 

^― 1 12+18 1 



■ + …16 

+…16 



= 123 

= 15(1 

= 282 

省份数目（爪） . 

mi=9 

m 2 = 11 

Nf 20 


123 

_ 159 

2S2 

平均收入 o). 

^产 - 9 -=i3,7 

x z = -j-j- — 14» 5 

x — ； — =14*1 

分祈第二 阶段： 确定组间偏离平方和 

地区（各个组）平均值 



Z)j= z!-J 2 h 

偏离地区问（总）平 

d l = \3^7 — 14.1 

d 2 = l4.5 — 14. 1 

2 

均收入值 （d) …… 

;一0,4 

= +0* 4 


偏离平方 （d 2 ). 

d ^=0. 16 

= 0 » i 6 

l 一 

分析第三 阶段： 确定各组偏离平方和 

各省收入偏离地民 

1*3* — 3 - 7+ 

! —2.5； 3.5 f 


(组）平均收入值 

— 0 . T ； — 1 . 7 ； 

2.5 ； 1.5 ； 一 2 , 5 j 


(a)... 

一 0 -T f 0*3- 

— 0.5; — K5i 



3.3; _ 0*7； 

一 2 . 5 一 0,5； 



2,3 

0.5: 1*5 


偏离平 /y(a 2 ). 

1.69; 13,69 

6,25； 12.25; 



0. 49^ 2, S9； 

6.25; 2 r 25 t 



0.49; 0.09； 

6,25; 0,25： 



10*89； 0*49： 

2.25； G,25； 



5.29 

j 0.25；0.25：2,25 
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(续表 > 


A' 


-指 数 ] 黑土地区（”0 1非黑土地区 （ A + p 〜圣/ •部 


偏與平方和 a 。 

E a 卜36,01 

a s 2 = 44,75 

I 

J ? i = a * 

+ 2 _j Gs 2 

= 30.76 

分析第四 阶段： 确定偏离乎方总和 

- 

各雀收入偏离间 

[L 9 ; 4 ■ t — 1 * 1 : 

— 2.1； H 

1 

<总）平均收入倚 ( c ) … 

— 2*1; — 1.1: 

2.9 山 — 

' 


一 0.1; 2*9； 

*— 0 . 1 H — 1 * 1 1 



一 1.1; +1.9 

—义 ■ i j _ 0* 1 j 

0.0； l.s 


偏离平方 （ e 2 〉. 

0. S： f IS . SJt 

1*21； 4. 41 j 

1.21: 0-0 J ; 

8.41； 1.21 ? 

3. G 1 

4.41 i 15.2 U 

fi ,4 i ； s.eii 

4.411 0. 01； 

].21： 4.41| 

0.01； 0.& J t 

S .61 

■ 

，偏离平力和(冗 

*4 ■ * * m 

1 Z C !^37, eo 

丨 

X ] c ^ = A 6 .n 

i 

D = 

= 37.69 

+ 46.11 

= 33-80 


对于确定方差所必需的、从上述计算结果中得到的偏离平方 
和，记入表28第2栏。 


方差分析的下一步，是确定地区之间、地区内部以及总的收 
入（因变量）方众所周知，确定方差需要用偏离平方和除以 
被抽选的考察样本数0,以便求得样本方差。但是，样本方盖过 
低地估计了包括着妯样样本的总体方差。如果样本数 S 不大，这 

.Ids * 








































种情况尤是。设若处于这种情況，要想得到_方盖最近估 
计> 可以用样本方差乘以系数+ \ 

tt — 1 a 

运用这个系数估计总体方差，可以按下列形式进行 T 


. 2—1： (卜卟 

* J ： -^ 

«— 1 o 

在这个方差估计中，分母等于表示 自由度 (fc) 的数目，即是^ 
考察样本数。这个自由度数字可以随意确定，而不受其他样本成 
分的约束。因此，在进行方差分析时，通常必须确定自由度数 
S. 让我们来详细考察这一步骤。 

自由度数 H 即统计序列成分的数目，它可以取这个序列平均 
算术值不变的任意值。例如，有一个平均算术值等于5,由3个 
成分组成的序列。这时，3个成分的序列总和为3X5 = 15。如果 
试图由3个成分中蜇新挑选成分組成其他的序列,而平均算术值 
还是5,那么随 :意或 自由地取值的只能有2个成分，因为第3个 
成分与这两个成分的总和必须是15,否则我们就得不到指定的平 
均算术值。因而，第3个成分自然地就已经被限定，处于其他两 
个成分以及平均算术值与总和的制约之下，它是“ 不自由的”。 
这就意味着，可以取任意值的序列的 “自由” 成分，或者在这3 
个成分的序列中自由度的数目，等于《— 1，即3 — 1=2。 

让我们在地主收入的例子中确定自由度的数目如果记得， 
为求得方差所必需的&由度数目取决于相应的偏离平方和是如何 
裉确 定的以及是在什么数目的材料基础上被确定的，那么，求得 
这个数目并不难。我们首先确定组间方差的 U 由度数目。确定地 
区£间的地主收入偏离平方和 （ 参见表28、29)，是用地区的乎均 
收入偏离两个地区平均总收入的乘方相加得来的。这样，我们就 
有了从既定平均值得到的由2个成分组成的序列。自由度数目因 
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此就是 2 —1 = 1。因为如果知道两个地区总平均收入，那么，# 
个地区中只能有一个地区可以任意或自由地确定平均收入,两另 
—个地区的收入将自然地即从 B 地被确定。 

现在我们来确定组内方差自由度的数自^确定地区内部偏离 
平方和，是用各省收入偏离地区乎均收 A 的乎方相加 Tft 。 因 
而，我们就有了平均值是由每一个序列2 结 1个 

序列的数目一^9个成分，第 2 个序列的自二个，第 i 个 
序列的自由度数目是 9_1 = 8，第2个序列的自由度数目为11 — t 
= 10,两个序列共计 8+ io ^ i % 这样，组内方藉的自由度数铒 
就小于原来各组的总数。在我们这个两个组的例子中，组内方差 
的自由度等于 20-2=^ 

确定所有参加分析的关于地主收入材料之间的偏离平方和， 
有两种方法：或者用各省收入偏离总平均收入的平方相加，或莕 
用组内偏离平方和与组间偏离平方和相加。第二种方法更简捷 Q 
但是，第一种方法有另一个优越性，以此求得的偏离平方和能够 
检验由组内偏离平方和与组间偏离平方和组成的偏离平方总和的 
正确性。譬如，在我们这个例 子中， 用两种方法计算出的偏离平 
方总和分别为 S 340 与83 ,96 ( 3 .20 + 80,76 ). 差数 0.16 并不大， 
因为它仅仅是受了将计算平均值& = 123+9-=13 4666四舍五入 
的影响，我们将其四舍五入为 13. 7, 

偏离平方和与自由度数目确定以后，用偏离平方和除以自由 
度数目，就轻而易举地得到方差。方差记入表28第3栏。 

方差分析的 T — 步，是将组间方差与组内方差或剩余方差进 
行比较。为此，需要计算方差比。在这种情况下，总蹙用方差值 
较大的一个除以较小的一个。所¥辱到的比用符号 F 表示。很明显， 
如果地主 itf 又波动主要取决于这个或那个地区地产的地理位置， 
那么地区间的收入方差应该大于地区内部的收入方差， 


150 •* 








F 实际 = 


g 2 组伺 5 


但是，根据抽样材料不能绝对精确地估计真实的方箜，即总 
体方差。样本方差不可避免的近似性，导致了方差比将不是完全 
精确的。由于这个原因，抽样的方差比可能 I 无抽样材 ft 偶然性 
的作用，换言之，由千样木方差存在着用^ 于 U 

因此，必须懂得，当方盖比 （ F ) 被偶知滅制钧酎莳正是受 
到被分析因素的影响。 

为此，需要用数学方法计算方差比的理论值。在自由度既定的 
情况下，如果实际方差比 （F 实际）小于理论方差比或统计表方 
差比 （F 统计），那么应该得出结论，这个方差比不是由于偶然 W 
产生的，并且，被考察的因岽具有重要的影响；相反，如果实际方 
差比大于理论方差比，那么，关千因素影响的假设就应该被否定。 

因此，关 丁， 考虑因素有重要影响这个结论的 F 统计的最大吋 
能值，处于与被比较方左自山度相应的纵行与横行的交点上。在 
我们的例子中， —\ f ^ = 18 , F 实际=1,40，① F 统计=247② 
( 在结论的概率水平 P = 0_0 5 的条件下）和 6 1別® (在概率水平 P 
= 0.01 的条件下）。 F 实宛小于 247， 因此，地产地理位置对于地土 
依赖自己地产的收入没有甫要的影响。 

在结论的概率为 0.05 和 Ck 01条件下，方差比各自意 味着仆 
么？概率水平④ 0.05 的含义可以表述如下。如果历史学家发现了 

4 

① 由^得到一译注 P 

② ( D 由专门数学统计表查得一一译注 。 _ 

© 在统计学中，概率水平表示统计结论犯错误的可能性的大小 。 简单说来， 
为要检验一个结论是否力真时，常常是构造一个使结论不真的事件 A, 概率 
水平 P =0.05 或 P = D_ 01表示 ：当 结论为真时，事件 A 在 lOfl 次中出现的次数 
不超过5次（对 P = D.05) 或1次（对 P = 0.0：l) a 该例想说明，如果样本选取不 
具普遍性，数学推断与实际情况可能会有矛盾一^译注。 
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关于地主收入的补充衬料，这些材料使拖岢以再编制一个样本序 
列，这个序列 在所有方面等类似坷 分析辟 2 0个省昀样本，那么在 
5钤的辦样本中， 銮晖 方差比 （F 实#)可以证明地产 1 地理位置没 
有给拌丰收入以影响 （F 实际将4、于 F 统计) ? 其时实际占搂昀地 
理位*对埤产收入有着重要的影响。 相棒 _， 在 概奉芬 的条 
件下， 在 1势的新样本中， F 实际可能小于时地产的地 
理位置对地主的收入具有影响。 •一- , : 

F 统计的理论值与概率相联系。碎高结论唆概率水平靡导致 
F 统计增加。因此\关于被考虑因素▲响结论的两个方差之间的 
最大可能比，在 P‘0_01 时将大于存 P={K05 时。在我们的例子 
中， P = .0*05 时， F 统计=247，而^? = 0_01时> JF 1 统计而 P 
几乎大24倍。结论的概率水平越髙> 估计的因素影响越璋慎，因 
此，如果研究者力图使结论有更大的可信性，那么他就应该在更 
高的 概奉永 平条件下寻求结论。但是，实践与理论都表明，在概率 
水平为 0.05 的条件下作出的结论，研究者已经可以 有理: 由确信。 
在单因素综合方差分析的最后阶段,是大致估计地户地理位 

• • I ■ j ■* 

置 一 被考虑因素影响的强度，以及其锥影响地产收入的因素的 
影响强度。估计是通过确定组间与组内偏离平方和 （ 不是方差! .) 
在收入#离乎方总和中的比例得到的 （ 参见表28)。地产地理位置 

- ■ v 

大约占地主收入变差的4庥，而其余因素#96势。如果方差分析表 
明这个因素对地产收入有意义，那么由此应该得出结讼，地产地 
理位置制约了地产牧入的既然方差分析已经否定了关于地产 
地理位置影响的假设，那么就可用我们抽选材料的偶然错误来解 
释4嗨。 

以上所进行的关于 1.9 世 M 50 年代地产地理位置对俄国地主收 
入影响材料的方差分析，是浩估计一个因素或一个变1：影响的时 
候分析一个因素综合的典型事例。 

• J5 彡 . 






收获 董改变 了吗？ 

方盖分析还可以用来阐明两个、三个、四个以及了般说来任 
何政玷因素的影响,似是，由于因素 g 越 & 释计算结 
果变捋阐难，而且,山于必须进行繁_§屬^通使用％子计算 
机的情况下），使分析任务极为复杂化。 S 践表明，3个因素综合 
的方左分析结染还杈可能闹释。而大数歯因岽的模型，适写分成 
一呰不太复杂的综合，然后对之单独进 n 公祈 a / 

让我《通过研究俄 m 收获史材料的实例，璋察对两个 H 索综 
合进行方左分析的特点。历史学家收* 了俄 M n —1 s 世纪收获历 
史的大&钫料，这些紂料记果了按迪区毎10年和每5 0年各神谷物 
收伏的动态，①丧30派话迫归纳了这些柯料。 

从这巧材料屮可以希到，在150年期 M ， 所观察到的俄国收 
获泣总 a 势是在提怛在咎烛试，各神谷物的收获 M 动态有很 
犬迫 异。 由此可以作出结论，收获里依赖于三个因衆：区、挤 
物种类和吋间。如杲取 " 迫区”作因素，芯异就表现在俄国各个 
地区的土质一气蛱和社会经济条忭方面；而取“粮食作物种类' 
作因素，盖异则在 P 这祌成那种作物生物学的特点以及农艺学的 
特征方面；以 <时间”为闲素，则指的是着起来自然而然地随着 
时间的推移对收成起作用的、某些其他的社会经济条件。 

但是，以上结论诰有缺陷的，因为它没有考虑到十分重要的 

情况：由援引材料中杳明的、根据每个地区以每 50 年和作物种类 
考察的收获遗的差异，可能 K 足偶然性.或样本平均数的错误所 


①£4弘英多娃:《中央俄罗斯收获150年（17怛纪下-半期至13泄纪)\载《东欧： 
土地史年鉴 （ 1965年苠斯科1970年 p .. 
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导致的，既是说，这些差异完全没苻受所指出的社会经济因素的 
制约。因此，关于地区、作物和时间影响收获 H 的结论是应该予 
以检验的 假设。 历史学家需分析一个问题：收获量的 动态逛 偶然 
产生的，还是受到地区、作物种类和时间具 有因果 ^的^约？ 
方差分析可以冋答这一问题。 r / / \ 

为了简化计算工作，解决任务分成两笫4段，揭 


*30 n 世纪下半期至 18 世纪中央俄罗斯粮食收成 
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4 t 6 

3.0 

3.8 

^.9 

3.8 

下 

3 

S.1 

5.2 

3-0 

3.7 

4.0 

4.0 

期 

4 

3 *t 

4-6 

3. 1 

3.9 

4, 0 

3-8 

全 

1 

199 

182 ; 

150 

147 

181 

859 


2 

3.4 

4,2 

3.1 

3.6 ! 

4.0 

3.6 

部 

3 

3.0 

3-4 

4.5 

4-3 

3.2 

3.5 

4,0 

3,6 

4 

3.2 

4.0 

3.3 

3.8 


注： 1_——材料数进1 2—. 黑麦 收成； 3—一燕麦收成^ 4一 .. 全部粮食平均收 
成。表中引用的材料是最低与最髙平均收成 B 


154 


























































示收获量动态依从于地区和时间的程度。为此目的，我 fr 】 将树料 
按照地区和50年的时间分组。第二阶段，揭*收成依从于作物种 
类和时间的程度。为此，需要将同一些材料按作物种类和10年时 
间分组。分析结果将回答 :在每 10年和50年的时 MM ， 辿区 和作物 
种类是否対17—18世纪俄 国收成 的动态_數响 

在转入对收成材料的分析之前，汁网个 
因素对收成影响的时候，不可避免地要考虑第个因素的彫响， 
即两个被考 虑因素 之间相 S 作用的影«, 这就是说，一方面要考 
虑地区与时间之间的相 互影响 ，另一方面要考虑作物与时间的相 
互影响。那么，因素的相互作用又指的是什么？ 

历史 T 家都懂得，农艺进步水 T 在各地区并不 相冋：非黑土 
地 区先进 一拽，黑太地 K 则落后一残。人们还知道， iUli : 纪屮期 
以时，各地区的荒地总额相差很大，因此，每个地区依 A 墙加新 
h 地来提 萵收获 量的可能性是不均衡的。此外，在口肽纪已鲐存 
在各个地 E 粮食虫产的专业化：北方要步产黑麦和燕麦；兩方 
主踅生产太麦和小麦。粮食也产专 、 lk 化也能影响各地区收获蜇的 
功态。这样，三个因素——地区、作物和时间的结合或相 A 作 
用，就可能对收获量动态产生很大的影响 a 因此，三个因索的这 
种结合和相互怍用是 必须 考虑的 a 多因素的方差分析,&恰.不仅 
能够揭示各个因素影响的程度，而且能够揭示这呰因素相作用 
的影响。这一点包括了方差分析提供的新内容。在两个冈索和準 
因素的综合分析中，除 J ； 不考虑因素相 a 作用以外，其他方面与 
多因素宄盖分析没有原则 K 别。 

进行两因素综合方差分析有几种方式。这几种方式在原则 
上相似的时候，它们各权利弊优劣。为了 了解方差分析的技巧 
(这 H 样适用于其他形式的数学分析~—一相关分析、间! H 分析 
等），必须注意，为了简化计算工作，需要将一系列过渡阶段引入 
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计算过程：将最初的变量形式简化、改变、编辑成附加统计表。 
这时常使经验不足的研究者难于弄清大量的公式、符号，有时甚 
至似乎“遗忘” 了方差分析的基本原则。为避免这种情况，需要 
很好地了解方差分析的基本 阶段： 1. 计算组间偏离变差$组内 
偏离变差的乎 方和； 2 . 计算自由度 , 3 . p 算方差 4.. 
比较实际方差与理论方逛比。了解有关方差务_基本步骤与基 
本逻辑知识，可以帮助历史学家掌捤计算4术厂 

让我们运用方盖分析，首先阐明地区和时间对于黑麦收获量 
动态的意义。为进行方差分析，将原始材料整理如表30。对这些 
材料进行方差分析的结果，参见表 3 U 

表31 方差分析 




偏离 

- 


方 

差比 

变 整 

来源 


自由度 

方差 

. . 

. . ’ 



平方和 



F 实际 

I 7 理论 

地 

K 

2,87 

4 

0,713 

5.06 

2,42 

吋 

H 

0,29 

2 

0-145 

U 02 

3,03 

地问的相互作用 

K 20 

8 

0+150 

1.06 

1-97 

地区与1付间的共 ㈣ 诈泪 

4,36 

U 

0-310 


— 

残 

差 

34.26 

242 

0.142 

参考基数 

1 

总 

计 

S 8. G 2 

256 


- 

— 


冏样的方法对地区和时间对于燕麦、大麦和小麦收成动态 
的通响进行方迨分析。所得出的结果说明，收获量的变化只取决 
于地区 的影晌 。 

对17—18世 紀收获 ffi 树料进行分析的第二阶段，如前所述， 
是耍阐明作物种类以及时间因素在每10年期间对粮食收获量的影 
晌。我们对17世纪下半期和 1 S 世纪的材料进行了方差分析(表 
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衷 32 方差分析 


.. 

变差来源 

偏离 

平方和 

自由度 

方差 

方 

差比 

F 实际 


稂食作物 

1.20 

3 

0,40 

2.35 

2. 63 

10 年 

0.85 

4 

0.21 

1,24 

穴40 

谷类作物与 10 年的相互 

1-74 

12 

G . 1 5 

1,13 

1,81 

作用 






作物与 10 年的共同作用 

3.79 

12 

0.32 



残 差 

52.21 

307 

0. 17 

参考 馳 

总 计 

沾.00 

326 

— 

— — 


对 1651— 1700年和 1巧1 一 1800年期间龙于各种作物收成的材 
料逬行方差分析，得到了类似的结果。 

那么，对〗 7— 18世纪收成历 史现有材料所 进行方差分析，可以 
得出什么结论呢？可以认为， 17—18 世纪粮食 收获量 的动态 ，只取 
决于 地区的 影响， 而不是取决于时间、 谷物 种类， 以及地 区与时 
间、谷物种类与时间、谷物种类与地区的相互作用， 因为只 有在估 
计收成对地区的依从关系时，方造实际比超过了理论比，这个结论 
意味着，似乎是从原始统计资料(表 30) 得出的关于粮食收获 H 具 
有提高 鎳势的 推测，实际上是 样本偶 然悴和 特殊性 导致的结果， 
也即 是说，粮食收获量的变化，并未受社会经济因素的制约。 

方差分祈还可以作出这个结论^根据历史学家掌握的现有的 
收获量的材料还不能认为，收成的水平和动态或多或少地取决于 
粮食作物的种类^看来，每10年和50年各种作物收获量水平的差 
异，也是山于偶然性和紅关收成材料不足所导致的结果 * 而没有 
受到社会经济因素和粮食作物生物学 特点的 制约。 


* tsr • 





























看来，收获量对 t 因素综合影响的依从性并 不大， 

明，！7—18世纪，因素的综合影响大概在地区之间还没-有 ® 著的 
差异，并且这种差异从这10年到那10年，从这个阶段到那个阶段 
也没有重要的变化，所以，它对 于收获 覃:水平和动态还没有较大 
影响 D 

至亍说到各地区之间收成水平和动态的差异，方差分析证实 
了基于对收成材料初步加工而提出的 假设： 地区之间收成水乎和 
动态之所以产生差异，是受到各地区地理和社会经济特点制约的 
合乎规律的结果。具体历史分析表明，各个地区怎样的特点导致 
各地区收成水平不同。在土壤肥力、农艺制度、封建剥削形式、森林 
数量及所有土地开 S 程度方面存在的荖別，所有这些造成了各 
地区收获量水平和动态之间的不同^在收集到关于这些因素相应 
的统计材料以后，可以再次进行估计这狴因素影晌的方差分析。 

这样，历史学家对17 — W 世纪俄国黑麦、燕麦、小麦和大茇 
收成资料所进行的方趋分析，为以下推侧提供了根据*各种作物 
收获量的动态和水平，各个时间段收获量的变化，并不存 在有规 
律的差异，但收获量水平和动态对于地区的依赖是存在的。巾原 
始资料表现出来的收获量的增长趋势，应被认为是样本存在偶然 
性和不完备性导致的结果。在拥有充足的收成资料的情况下，尖 
于收成增长的趋势也许会“消逝％但是，不应由此认为历史学家 
收集的资料不可信， 而码该 认为，只是这些资料不 足以有根据堆 
得出收成增长这一结论。 

应该强调，方差分析不能代替所缺乏的资料，而只能批判地 
估价历史学家获得的资料。通过严格考察类似资料仅仅证明，收 
成随时间而强烈波动，同时具有穣定的 a 势，在 iso 年期间没有 
任何增长3自然，还可能有另外的关于18世纪收成的资料可 
资重新考察该结论，但在 B 前的认识阶段，关于收获量趋势是稳 
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定的这一结论， 鼉合乎实际。 

在进行方差分析时，有一呰条件是研究者^须^重@的 


1. 方差分析适于选用这种资料：它们在总体中呈常态分布或 
近似常态分布。所抽选的各个考察样本或材料不相联系，或互相 
没有依从关系。 

2 . 在各个组和组群，因变量变化的性质或原因都是同样的。 
3 +通过各个因素影响的相加而不是相乘，求得各个因素对 

因变量的总影响。 


4. 各种特征的材料数量（地区、作物、阶段等等）或相等， 
或成比例。 


违反上述条件的时候，也不排斥运用方差分析。但在这种情 
祝下，估价因素影响的准确性较小，总结论的可靠性也较小。因 
此，在进行方差分析之前，预先查明在多大程度上具备了上面要 
求的条件是有益的。在收获量历史的例子中，基本具备了进行方 
差分析的条件。在全俄，按照收获量水平，地产的分布受常态分 
布规律的支配。因为大部分地产 （ 60— 70?& ) 具有平均水乎的 
收获量，而其余的地产，大约以相等的比例组成高的收获量和低 
的收获量两个地产组。各份地产的收成互相并不依赖，，因为它们 
之间没有影响， 

备份地产收获量波动的原因都是同样的：受地产的社会经 
济，地理特点以及地产占有者经营素质的影响，而收获 M 波动的 
性质 也是同 样的。 

各个因素对收获量影晌的总效果，是通过各个因素影响相加 
而得到的。这从下面一点很清楚地反映 出来: 各个地区平均收成互 
相区别不太大，因为平均差异在100篼以内。而方差分析的实 践表 
明，如杲因素影响总效果是®过各个因素相乘得 到时； 那么组平 
均收莸量值应该很大 一 相互之间的遊异达到 几倍。 
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最 厄， 按照地区和时间阶段对收获量资料划分的缉和 组胃银 
数目是成比例的 （ 参见表 so ), 在这3个时间阶段的每 tnr 段;£ 
内 （ 17世纪下半期、18世纪上半期和下半期），资刺*的相对数冃 
( 地区范围的资料在全俄资料总数中所占的百分比或比例）本致 
是一样的。因为从一个10年到另一个10年，在所有的 地区， 材料 
的数3是按照一个大体上均衡的比例增加的。 

我们所考察的方遐分析的事例，非常鲜明地盛示出这种方法 
的优点。我们首先发现，方范分析在逻辑和技术 方面糠 + 分简 
便，并且还有通用性：无论对质的特征还是暈的特征，这种方法 
同样适用。 （g 是，在研究異有质的表现形式的因素影响时运用方 
差分析更为有益。研究社会史、政治史和文化史的学者 ，在 大多 
数情况下，遇到的是类似质的因素因此在历史学中，方差分祈应 
该被认为是可以运用它来取得丰硕成果的十分重要的分析工具。 

举例来说，由于历史研究的目的是要揭示现象和进程在时间 
和空间中的进化，因此在时间、空间或地理范围内研究历史现 
象，成为任何历史研究不可缺少的部分。而在历史学中，由于历 
史学家分析的范畴主要是时期、阶段、时代，而不是小时 、分、 
秒 J 是省、地区、 i 家，而不是宽度与长度 t 因此，绝大部分的空 
间和时间以不具有数量确定性的质的特征表现出来。运用方兹分 
析恰好能够估价时间和空间对所研究的历史现象的影响，并以此 
为基础固答这一问題：历史学家通过考察保存下来的过去的资料 
而发现的变化，是遵循着一定规律的，还是偶然发生的？有赖于 
此，才有可能髙度准确地确定被研究观象在时间和空间的进化中 
是否存在着有规律的发展趋势。这只是方差分析在历史研究中诸 
多应用中的一种 b 

在结束时我们想强调，本书使读者有可能熟悉在历史研究中 
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运用的某呰最著名的数学、方法了解它们在历史嗲义 V 邀-辑 _ 
和意义。在独立工作中，读者有可能进一步掌握这些数学方法，并 
il 主要不是从数学和统计学的教科书中，而是从为分析具休历史 
资料而运 m 数学方法的实跋中。当然，进一歩掌握数空方法并非 
易事，但是、进行这种努力却会饶有趣味和卓有成效，并且对于 
任何一个历史学家来说，也是完全力所胜任的。由于在历史学中 
运用数学方法是历史科学中诸多靳的、年轻的领域之一，因此， 
其中有许多新的、未知的东西。对于每一个愿意在这里贡鱗自 Q 
力量的学者，这个领域有无限广阔的活动天地。 
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